← 대시보드로

방법론

HeatNews 점수 산출 공식과 데이터 처리

1. 데이터 수집

2. 테마 노출(prominence) 점수

각 투자 테마의 뉴스 노출량은 다음 공식으로 산출합니다:

articleCount × 1.0 + uniquePublishers × 0.35 + termHits × 0.15 − spamPenalty

articleCount는 기사 수, uniquePublishers는 다양한 매체 가중치, termHits는 테마 키워드 노출 빈도이며 spamPenalty는 도배성 기사 패널티입니다.

3. 종목 매칭 신뢰도(confidence)

한 종목이 특정 테마에 속한다는 신뢰도 점수:

min(0.2 + aliasHits × 0.26 + (aliasHit ? 0.42 : 0) + themeHits × 0.08, 0.98)

기본 표시 임계값은 0.58이며, 매칭 방식은 다음과 같이 구분됩니다:

4. 반응(reaction) 점수

테마의 시장 반응 점수는 신뢰도로 가중평균한 상대수익률입니다:

Σ(confidence × relativeReturn) ÷ Σ(confidence) → [-15, 15] 클램프

상대수익률 = 종목 변동률 − 벤치마크(KOSPI/KOSDAQ) 변동률. 트리맵 색상은 sqrt 스케일이며 ±5%에서 색이 포화됩니다.

5. 중복 제거

제목을 정규화(소문자 변환 + 공백 압축) 후 일치하면 동일 기사로 처리합니다. 동일 사건을 여러 매체가 보도해도 단일 기사로 카운트됩니다.

6. 색상·시각화

관련 페이지

⚠ 모든 데이터·점수·분석은 투자 참고 자료이며 투자 권유가 아닙니다. 매매 판단은 사용자 본인 책임이며, 본 서비스는 결과에 대한 책임을 지지 않습니다.