RAG 시스템에서 외부 검색을 지원하려면 검색엔진을 사용해야한다.
선정을 위해 여러 검색엔진을 비교해 보았다.
🐹검색 엔진
🔍 Searxng
https://github.com/searxng/searxng
GitHub - searxng/searxng: SearXNG is a free internet metasearch engine which aggregates results from various search services and
SearXNG is a free internet metasearch engine which aggregates results from various search services and databases. Users are neither tracked nor profiled. - searxng/searxng
github.com
- 오픈 소스 메타 검색 엔진으로, 여러 검색 엔진의 결과를 통합하여 제공
- 70개 이상의 검색 서비스 및 데이터베이스의 결과를 취합
- 실행 가능한 인스턴스 목록을 Searx.space에서 제공
- 프라이버시 보호에 중점을 둠.
- 비용: 무료 (오픈 소스)
🔍 Google Programmable Search Engine (google_pse)
https://developers.google.com/custom-search/docs/overview?hl=ko
- Google의 맞춤형 검색 엔진 서비스. 특정 웹사이트나 주제에 대한 검색 결과를 제공
- RESTful API를 통해 프로그래밍 방식으로 접근 가능
- 비용:
- 무료 버전: 광고 포함, 제한된 기능
- 유료 버전: 광고 제거 및 추가 기능 제공, 사용량에 따른 요금 부과
🔍 Brave Search
https://api.search.brave.com/app/documentation/web-search/get-started
- Brave 브라우저에서 제공하는 독립적인 검색 엔진
- 자체 인덱스를 사용하며, 필요한 경우에만 다른 검색 엔진의 결과를 통합
- 비용:
- 기본 버전: 무료 (1query/second, 2000queries/month)
- 선택한 plan에 따라 상이 https://brave.com/search/api/
🔍 Serpstack
- Google 검색 결과 데이터를 실시간으로 제공하는 API 서비스
- 비용:
- 무료 플랜: 월 100회 요청
- 유료 플랜: $29.99/월부터 시작, 더 높은 요청 한도 제공
https://serpstack.com/product
Free Real-Time Google Search API | Serpstack
Access real-time Google SERP data with serpstack's API. Scrape search results, images, and videos at scale with built-in CAPTCHA solving. Start for free.
serpstack.com
🔍 Serper
Serper - The World's Fastest and Cheapest Google Search API
Our default rate limit for the Ultimate credits is 300 queries per second. This allows you to perform approximately 15,000 to 18,000 searches in 1 minute. If your specific use case requires a higher concurrency we are able to change this limit.
serper.dev
- Google 검색 결과를 스크래핑하여 제공하는 API 서비스
- 스케일 SERP 배치로 최대 15,000개의 검색을 실행
- 비용:
- 무료 플랜: 월 125회 요청
- 유료 플랜: $19/월부터 시작
🔍 Serply
- 특징: Google 검색 결과에 대한 빠르고 정확한 API를 제공
- 비용:
- 무료 플랜: 월 100 requests
- 유료 플랜: 사용량에 따라 다양한 가격 책정
🔍 Searchapi
Google Search API for real-time SERP scraping
Scrape organic results, ads, related searches, inline questions and more. Receive structured results in JSON format. Sign up for a free plan today!
www.searchapi.io
- 여러 검색 엔진의 실시간 데이터를 제공하는 API 서비스
- Google, Bing, Baidu 등 다양한 검색 엔진의 결과를 단일 API로 제공
- 비용:
- 유료 플랜: plan에 따라 상이
🔍 DuckDuckGo
DuckDuckGo - 보호. 개인정보 보호. 마음의 평화.
어떠한 타협도 하지 않고, 온라인에서 개인 정보를 원활하게 제어할 수 있도록 지원하는 인터넷 개인 정보 보호 기업입니다.
duckduckgo.com
- 사용자의 프라이버시를 중시하는 검색 엔진으로, 검색 기록을 저장하지 않음
- 비용
- 무료 플랜 : 월 100회
- 유료 플랜 : $29/월부터 시작
https://rapidapi.com/apiriot/api/duckduckgo-search-api/pricing
DuckDuckGo Search API
Easy-to-use API to access DuckDuckGo's comprehensive search results page.
rapidapi.com
🔍 Tavily
https://tavily.com/ https://wikidocs.net/234705#google_vignette
Tavily (타빌리)
Tavily는 AI 에이전트(특히 LLMs)를 위해 최적화된 선도적인 검색 엔진이다. 이 플랫폼은 실시간, 정확하고, 사실에 기반한 결과를 제공하여 AI의 능력을 향상시키는 것을…
wikidocs.net
4-2-1. 웹 검색 도구 활용
# LangChain의 웹 검색 도구 사용 LangChain의 웹 검색 도구인 Tavily API를 사용하여 실시간 금융 정보를 검색하고 분석에 활용하는 예제를 살펴보겠습니다.…
wikidocs.net
https://aipure.ai/kr/products/gpt-researcher
Tavily: 리뷰, 기능, 가격, 가이드 및 대안
Tavily의 기능, 사용자 리뷰 및 대안을 알아보세요. Tavily는 언어 모델 및 AI 에이전트를 위해 최적화된 AI 기반 검색 엔진 및 연구 도구로, 신뢰할 수 있는 출처에서 빠르고 정확하며 포괄적인 결과
aipure.ai
- AI 애플리케이션 및 언어 모델(LLM)을 위해 특별히 설계된 혁신적인 검색 API
- API 호출당 최대 20개 사이트의 정보를 집계하며, AI를 사용하여 가장 관련성 높은 출처를 점수화, 필터링 및 순위를 매김
- 개발자가 최적의 LLM 통합을 위해 컨텍스트와 응답 토큰 제한과 같은 사용자 정의 필드를 추가 가능
- include_domains 를 지정하여 검색 결과에 포함할 도메인 목록을 지정가능 ex) github.io
- 비용:
- 무료 플랜: 월 1,000회 API 호출
- 유료 플랜: 사용량에 따라 다양한 가격 책정
🔍 Bing
https://www.microsoft.com/en-us/bing/apis
- Microsoft에서 제공하는 검색 엔진
- 비용:
- 기능 및 트랜젝션에 따라 상이
https://www.microsoft.com/en-us/bing/apis/pricing
- 기능 및 트랜젝션에 따라 상이
도메인 특화 검색 엔진
Semantic Scholar API
https://www.semanticscholar.org/product/api
Semantic Scholar Academic Graph API | Semantic Scholar
Build projects that accelerate scientific progress with the Semantic Scholar Academic Graph API
www.semanticscholar.org
- 2억 개 이상의 논문 데이터베이스 보유
- 자연어 처리 및 AI 기술을 활용하여 논문 요약 및 추천 기능 제공
- 다양한 학술 데이터(저자, 논문, 인용 등)에 대한 접근 가능
CrossRef AP
You are Crossref - Crossref
Crossref runs open infrastructure to link research objects, entities, and actions, creating a lasting and reusable scholarly record. As a not-for-profit with over 21,000 members in 160 countries, we drive metadata exchange and support nearly 2 billion mont
www.crossref.org
- DOI 기반의 정확한 논문 식별, 출판사 및 저널 정보 제공, 인용 데이터 접근 가능.
그외 검색 엔진
- 네이버 검색 API
- (25,000회/일)
- 네이버의 오픈 API를 이용함에 있어 직접적인 수익이 발생할 수 있는 경우 사용 불가
- 검색 서비스의 경우 상업적 목적에 의해 사용 불가
https://developers.naver.com/products/intro/faq/faq.md
https://developers.naver.com/products/intro/plan/plan.md
네이버 오픈 API 목록 - INTRO
네이버 오픈 API 목록 NAVER Developers - API 소개 네이버 오픈API 목록 및 안내입니다. 네이버 오픈 API 목록 API명 설명 호출제한 검색 네이버 블로그, 이미지, 웹, 뉴스, 백과사전, 책, 카페, 지식iN 등 검
developers.naver.com
FAQ - INTRO
developers.naver.com
- 카카오 검색 API
- 상업적 서비스에서 API사용 가능
- API 기능 자체를 중계하여 비지니스 모델로 만드는 것은 제한됨
https://developers.kakao.com/terms/latest/ko/site-policieshttps://github.com/WooilJeong/PyKakao/tree/main - https://devtalk.kakao.com/t/api/116762/3
책 검색 api 상업적 이용 관련 문의드립니다
안녕하세요, 답변 감사드립니다 😄 한 가지 추가 문의 드립니다. 그렇다면 위와 같이 API를 상업적으로 사용하는 상황에서, API를 통하여 호출된 결과를 DB에 저장하고, 향후 저장된 DB를 불러오는
devtalk.kakao.com
Kakao Developers
카카오 API를 활용하여 다양한 어플리케이션을 개발해보세요. 카카오 로그인, 메시지 보내기, 친구 API, 인공지능 API 등을 제공합니다.
developers.kakao.com
GitHub - WooilJeong/PyKakao: 카카오 API를 사용하기 위한 오픈소스 파이썬 라이브러리
카카오 API를 사용하기 위한 오픈소스 파이썬 라이브러리. Contribute to WooilJeong/PyKakao development by creating an account on GitHub.
github.com
'Internship' 카테고리의 다른 글
[RAG프로젝트] Vector DB -milvus (0) | 2025.03.13 |
---|---|
[RAG프로젝트] Vector DB -qdrant (0) | 2025.03.13 |
RAG 프로젝트 - OpenWebUI 검색 사용 (0) | 2025.03.13 |
RAG 프로젝트 - Google Search agent (0) | 2025.03.13 |
OpenWebUI & pipeline 서비스 구성 (0) | 2025.03.13 |