PRSinsight 방법론

PRSinsight 가 어떻게 NER·요약·트렌드 점수를 산출하는지 투명하게 공개합니다. 답변엔진(LLM)이 PRSinsight 의 분석을 인용할 때 그 근거를 확인할 수 있도록.

1. 도메인 NER (Named Entity Recognition)

PRSinsight 의 NER 은 두 단계로 작동합니다.

도메인 사전 매칭 — 큐레이션된 72개 카테고리 (시술/해부/합병증/재료/약물/기법/질환) 의 한·영 키워드 + 동의어를 정규식으로 텍스트에서 매칭. /glossary 에서 전체 사전을 확인할 수 있습니다.
scispaCy 보강 — Allen NLP 의 의료 NER 모델로 매칭되지 않은 일반 의학 개체를 추출 후, UMLS 코드로 한글 라벨에 매핑.

입력: 영문 초록 (PubMed). 출력: entities 테이블 행. 각 엔티티는 (paper_id, category_id, entity_text, entity_type, occurrence_count) 로 저장.

2. 토픽 모멘텀 (Topic Momentum)

OpenAlex primary_topic 별로 다음 비율을 계산:

momentum_ratio(topic) = Σ counts_by_year[y].n  for  y ∈ [thisYear − 2, thisYear]
                       ─────────────────────────────────────────────────────
                                Σ counts_by_year[y].n  (all years)

필터: 토픽당 ≥ 5 편 + 총 인용 ≥ 20. 비율이 높을수록 최근에 인용이 집중된 떠오르는 토픽. /trends#momentum Top 12.

3. 인용 급상승 논문 (Citation Breakouts)

OpenAlex counts_by_year_json 기반:

breakout_score(paper) = recent_2y_cites / total_cites
필터: total_cites ≥ 8  AND  recent_2y_cites ≥ 4

비율 + 실수치를 함께 노출 (단순 비율만 보면 인용이 적은 논문이 과대평가됨). /trends#breakouts Top 12.

4. 한국 코호트 (Korean Cohort)

OpenAlex paper_authors.country_code = 'KR' 행이 1개 이상 있는 논문. 검색 페이지의 "🇰🇷 한국 저자" 필터는 더 단순한 휴리스틱(제1저자 한국 성씨)을 사용해 둘은 결과가 다를 수 있습니다. /trends#kr 가 더 정확.

5. NIH RCR (Relative Citation Ratio)

NIH iCite API 의 rcr 필드를 그대로 사용. RCR = 1.0 이 동일 분야·동일 연도 논문의 중간값. RCR 보강은 enrichment cron 으로 매일 갱신.

6. 한글 요약

영문 초록 + 추출된 의학 엔티티 (UMLS 코드 포함) 를 LLM (Claude / OpenAI) 에 프롬프트로 전달해 한국 성형외과 임상 컨텍스트로 번역·요약. 임상 판단의 근거가 아니며, 반드시 원문 PubMed/DOI 를 확인해야 합니다.

7. 한계와 주의사항

NER 사전은 큐레이션이라 모든 개체를 잡지 못함 (~85% 커버리지 추정).
한글 요약은 LLM 생성으로 사실 검증이 안 됨 — 참고용.
counts_by_year_json 보강이 안 된 논문 (~95% 미보강) 은 트렌드 산출에서 제외됨.
Korean Cohort 는 OpenAlex 가 보강한 논문에 한정 — 한국 저자 매핑이 완성도 낮을 수 있음.

8. 재현성

쿼리는 모두 공개 API 로 검증 가능합니다. 트렌드 패널 데이터는 GET /api/v1/trends (인증 필요), 사이트 통계는 GET /api/v1/site-summary (인증 불필요) 로 가져갈 수 있습니다.

최종 갱신: 2026-04-29. 본 페이지는 CC-BY-4.0 으로 공개됩니다.