DeepNews - 뉴스 1억 기사 분석 MCP 서버
72개 언론사 1억+ 기사를 LLM이 바로 조회·분석할 수 있도록 설계한 MCP 서버. 토큰 소비 92% 절감.

배경/문제
언론사 API로는 실시간 뉴스 조회 시 토큰 낭비가 심했다. 원문 전체를 LLM 컨텍스트에 넣으면 불필요한 정보까지 처리되고, 72개 언론사 1억 건 규모 데이터를 효율적으로 탐색하기 어려웠다. Claude 같은 LLM이 뉴스 분석 작업을 자동화하려면 자체 MCP 서버로 구조화된 요약과 메타데이터를 직접 제공해야 했다.
접근
KcBERT 기반 한국어 임베딩과 BM25 키워드 검색을 결합한 하이브리드 검색으로 재현율과 정확도를 모두 확보했다. FastAPI 서버에 MCP 인터페이스를 구현하여 Claude, Cursor 같은 LLM 클라이언트가 stdio와 HTTP로 직접 질의할 수 있게 설계했다. 72개 언론사별 기사를 시간대별로 인덱싱하고, 질의에 대해 구조화된 요약(제목, 요약, 핵심 문맥)만 반환함으로써 토큰 효율을 극대화했다.
결과·지표
토큰 소비 92% 절감 달성. 시계열 트렌드 분석, 언론사별 논조 비교, 공공 정책 이슈 모니터링 등 실무 사용사례에서 0.3초 이내 응답 시간 확보.
스택 상세
- 언어/런타임: Python, FastAPI
- NLP: KcBERT 기반 한국어 임베딩
- 검색: Hybrid Retrieval (BM25 키워드 + 벡터)
- 데이터 인덱싱: PostgreSQL, Redis (캐싱)
- 인터페이스: MCP over stdio / HTTP
링크
구성 요소와 사용 설명서는 seolcoding 조직을 참고하세요.