Internship

RAG 시스템 검색 엔진 정리

✿(๑❛ڡ❛๑)✿ 2025. 3. 13. 15:41
728x90
SMALL

RAG 시스템에서 외부 검색을 지원하려면 검색엔진을 사용해야한다.

선정을 위해 여러 검색엔진을 비교해 보았다.

🐹검색 엔진

🔍 Searxng

https://github.com/searxng/searxng

 

GitHub - searxng/searxng: SearXNG is a free internet metasearch engine which aggregates results from various search services and

SearXNG is a free internet metasearch engine which aggregates results from various search services and databases. Users are neither tracked nor profiled. - searxng/searxng

github.com

 

  • 오픈 소스 메타 검색 엔진으로, 여러 검색 엔진의 결과를 통합하여 제공
  • 70개 이상의 검색 서비스 및 데이터베이스의 결과를 취합
  • 실행 가능한 인스턴스 목록을 Searx.space에서 제공
  • 프라이버시 보호에 중점을 둠.
  • 비용: 무료 (오픈 소스)

🔍 Google Programmable Search Engine (google_pse)

https://developers.google.com/custom-search/docs/overview?hl=ko

 

  • Google의 맞춤형 검색 엔진 서비스. 특정 웹사이트나 주제에 대한 검색 결과를 제공
  • RESTful API를 통해 프로그래밍 방식으로 접근 가능
  • 비용:
    • 무료 버전: 광고 포함, 제한된 기능
    • 유료 버전: 광고 제거 및 추가 기능 제공, 사용량에 따른 요금 부과

🔍 Brave Search

https://brave.com/search/

https://api.search.brave.com/app/documentation/web-search/get-started

  • Brave 브라우저에서 제공하는 독립적인 검색 엔진
  • 자체 인덱스를 사용하며, 필요한 경우에만 다른 검색 엔진의 결과를 통합
  • 비용:

 

 

🔍 Serpstack

https://serpstack.com/

 

  • Google 검색 결과 데이터를 실시간으로 제공하는 API 서비스
  • 비용:
 

Free Real-Time Google Search API | Serpstack

Access real-time Google SERP data with serpstack's API. Scrape search results, images, and videos at scale with built-in CAPTCHA solving. Start for free.

serpstack.com

 

🔍 Serper

https://serper.dev/

 

Serper - The World's Fastest and Cheapest Google Search API

Our default rate limit for the Ultimate credits is 300 queries per second. This allows you to perform approximately 15,000 to 18,000 searches in 1 minute. If your specific use case requires a higher concurrency we are able to change this limit.

serper.dev

 

  • Google 검색 결과를 스크래핑하여 제공하는 API 서비스
  • 스케일 SERP 배치로 최대 15,000개의 검색을 실행
  • 비용:
    • 무료 플랜: 월 125회 요청
    • 유료 플랜: $19/월부터 시작

🔍 Serply

https://serply.io/

 

  • 특징: Google 검색 결과에 대한 빠르고 정확한 API를 제공
  • 비용:
    • 무료 플랜: 월 100 requests
    • 유료 플랜: 사용량에 따라 다양한 가격 책정

🔍 Searchapi

https://www.searchapi.io/

 

Google Search API for real-time SERP scraping

Scrape organic results, ads, related searches, inline questions and more. Receive structured results in JSON format. Sign up for a free plan today!

www.searchapi.io

 

  • 여러 검색 엔진의 실시간 데이터를 제공하는 API 서비스
  • Google, Bing, Baidu 등 다양한 검색 엔진의 결과를 단일 API로 제공
  • 비용:
    • 유료 플랜: plan에 따라 상이

🔍 DuckDuckGo

https://duckduckgo.com/

 

DuckDuckGo - 보호. 개인정보 보호. 마음의 평화.

어떠한 타협도 하지 않고, 온라인에서 개인 정보를 원활하게 제어할 수 있도록 지원하는 인터넷 개인 정보 보호 기업입니다.

duckduckgo.com

 

 

DuckDuckGo Search API

Easy-to-use API to access DuckDuckGo's comprehensive search results page.

rapidapi.com

 

🔍 Tavily

https://tavily.com/ https://wikidocs.net/234705#google_vignette

 

Tavily (타빌리)

Tavily는 AI 에이전트(특히 LLMs)를 위해 최적화된 선도적인 검색 엔진이다. 이 플랫폼은 실시간, 정확하고, 사실에 기반한 결과를 제공하여 AI의 능력을 향상시키는 것을…

wikidocs.net

 

https://wikidocs.net/261568

 

4-2-1. 웹 검색 도구 활용

# LangChain의 웹 검색 도구 사용 LangChain의 웹 검색 도구인 Tavily API를 사용하여 실시간 금융 정보를 검색하고 분석에 활용하는 예제를 살펴보겠습니다.…

wikidocs.net

 

https://aipure.ai/kr/products/gpt-researcher

 

Tavily: 리뷰, 기능, 가격, 가이드 및 대안

Tavily의 기능, 사용자 리뷰 및 대안을 알아보세요. Tavily는 언어 모델 및 AI 에이전트를 위해 최적화된 AI 기반 검색 엔진 및 연구 도구로, 신뢰할 수 있는 출처에서 빠르고 정확하며 포괄적인 결과

aipure.ai

 

  • AI 애플리케이션 및 언어 모델(LLM)을 위해 특별히 설계된 혁신적인 검색 API
  • API 호출당 최대 20개 사이트의 정보를 집계하며, AI를 사용하여 가장 관련성 높은 출처를 점수화, 필터링 및 순위를 매김
  • 개발자가 최적의 LLM 통합을 위해 컨텍스트와 응답 토큰 제한과 같은 사용자 정의 필드를 추가 가능
  • include_domains 를 지정하여 검색 결과에 포함할 도메인 목록을 지정가능 ex) github.io
  • 비용:
    • 무료 플랜: 월 1,000회 API 호출
    • 유료 플랜: 사용량에 따라 다양한 가격 책정

🔍 Bing

https://www.microsoft.com/en-us/bing/apis

 

 

도메인 특화 검색 엔진


Semantic Scholar API

https://www.semanticscholar.org/product/api

 

Semantic Scholar Academic Graph API | Semantic Scholar

Build projects that accelerate scientific progress with the Semantic Scholar Academic Graph API

www.semanticscholar.org

 

 

  • 2억 개 이상의 논문 데이터베이스 보유
  • 자연어 처리 및 AI 기술을 활용하여 논문 요약 및 추천 기능 제공
  • 다양한 학술 데이터(저자, 논문, 인용 등)에 대한 접근 가능

CrossRef AP

https://www.crossref.org/

 

You are Crossref - Crossref

Crossref runs open infrastructure to link research objects, entities, and actions, creating a lasting and reusable scholarly record. As a not-for-profit with over 21,000 members in 160 countries, we drive metadata exchange and support nearly 2 billion mont

www.crossref.org

  • DOI 기반의 정확한 논문 식별, 출판사 및 저널 정보 제공, 인용 데이터 접근 가능.

 

그외 검색 엔진


 

네이버 오픈 API 목록 - INTRO

네이버 오픈 API 목록 NAVER Developers - API 소개 네이버 오픈API 목록 및 안내입니다. 네이버 오픈 API 목록 API명 설명 호출제한 검색 네이버 블로그, 이미지, 웹, 뉴스, 백과사전, 책, 카페, 지식iN 등 검

developers.naver.com

 

 

FAQ - INTRO

 

developers.naver.com

 

 

책 검색 api 상업적 이용 관련 문의드립니다

안녕하세요, 답변 감사드립니다 😄 한 가지 추가 문의 드립니다. 그렇다면 위와 같이 API를 상업적으로 사용하는 상황에서, API를 통하여 호출된 결과를 DB에 저장하고, 향후 저장된 DB를 불러오는

devtalk.kakao.com

 

 

Kakao Developers

카카오 API를 활용하여 다양한 어플리케이션을 개발해보세요. 카카오 로그인, 메시지 보내기, 친구 API, 인공지능 API 등을 제공합니다.

developers.kakao.com

 

 

GitHub - WooilJeong/PyKakao: 카카오 API를 사용하기 위한 오픈소스 파이썬 라이브러리

카카오 API를 사용하기 위한 오픈소스 파이썬 라이브러리. Contribute to WooilJeong/PyKakao development by creating an account on GitHub.

github.com

 

728x90
LIST