콘텐츠로 이동

20. 팩트체크 교차 검증

한 줄 요약

공식 페이지 하나만 믿지 말고, 최신 언론 보도로 한 번 더 확인한다. 충돌하면 최신 쪽을 신뢰하고 두 출처 다 남긴다.

비유

전세 계약 전에 등기부등본 한 번만 떼는 사람이 당하는 이유와 같다. 등기부에는 어제 바뀐 내용이 아직 반영 안 됐을 수 있다. 오늘자 뉴스, 오늘자 동사무소 확인까지 해야 사고 안 난다.

공식 페이지도 똑같다. "업데이트가 느리다"는 전제로 접근해야 한다.


왜 이게 필요한가

실수 사례 — 2026-04-20 대릉원 천마총 포스팅

1차 팩트체크 (경주문화관광 공식 페이지)

"주차 : 대릉원 공영주차장(유료), 노동공영주차장(유료), 쪽샘 임시주차장(무료)"

공식 페이지만 믿고 블로그에 "쪽샘 무료"로 썼으면 → 허위 정보 발행.

2차 팩트체크 (아시아투데이 2026-01-11 보도)

"쪽샘지구 임시공영주차장, 2026년 2월 1일부터 유료 전환. 20분 무료, 30분 500원, 1일 최대 1만원"

공식 페이지가 3개월째 업데이트 안 된 상태였다. 실제로는 이미 유료. 언론 보도가 맞았다.

교훈: - 공식 = 무조건 최신이 아니다 - 요금·운영시간·정책 같은 변동 정보는 특히 교차 검증 필수 - 언론 보도 발행일을 반드시 확인


3단계 팩트체크 루트

1단계: 공식 1차 출처

  • 해당 기관 공식 홈페이지 (경주시청, 문화재청, 해당 기업 공식 등)
  • 공식 보도자료
  • 위키백과 (출처 링크 따라가기)

2단계: 최근 1년 이내 언론 보도

  • 검색: "해당 주제" site:news.naver.com 또는 "해당 주제" 2026년
  • 발행일 확인 → 최신부터 역순으로
  • 지역 신문(경북일보, 아주경제 등)이 공식보다 빠른 경우 많음

3단계: 충돌 시 판단

상황 신뢰할 쪽 표기 방법
공식만 있음 공식 출처 URL 명시
공식 + 최신 보도 일치 둘 다 공식 우선
공식 = 과거 / 보도 = 최신 최신 보도 "YYYY년 M월부터 변경됨" 명시
보도끼리 충돌 공식 문의 전화번호 안내 추가

유형별 체크 포인트

① 숫자 (인원, 요금, 면적, 규모)

  • 위험 표현: "약 890면", "대략 1만 명", "최대"
  • 안전 패턴: 공식 숫자 그대로 인용 + 출처
  • 교차 검증 필수: 숫자는 보도마다 다름 (890 vs 894면 같은 경우)

② 시간/일정 (개장, 휴무, 전환 시점)

  • 위험: "상반기", "하반기", "올해부터"
  • 안전: "2026년 2월 1일부터" 같은 구체 날짜
  • 반드시 체크: 최근 6개월 내 정책 변경 여부

③ 무료/유료 여부

  • 가장 위험한 정보. 정책 자주 바뀜
  • 공식 + 지역 언론 + 블로그 후기(최근 1개월) 3중 체크
  • "현재는 무료지만 YYYY년 M월부터 유료 전환 예정"으로 쓰면 안전

④ 명칭/명명

  • 공식 명칭 vs 통칭 구분
  • 예: "대릉원 공영주차장"(통칭) / "대릉원(황남지구) 공영주차장"(정식)
  • 본문에 한 번은 정식 명칭 언급

⑤ 인용/귀속 (명언, 인물 발언)

  • Quote Investigator, Wikiquote로 오귀속 확인
  • 처칠·만델라·아인슈타인은 특히 가짜 귀속 많음
  • 저자·제목·출판사 → Goodreads/Wikipedia 직접 확인 (에이전트 답변 신뢰 금지)

⑥ 최상급 표현

  • "최고", "최대", "유일", "현존 가장"
  • → 공식 근거 없으면 쓰지 말 것
  • 예: "국내 유일하게 왕릉 내부 들어가는 곳" → 무령왕릉 과거 개방 이력 때문에 반박 가능 → "신라 고분 중 유일"로 좁혀 안전화

팩트체크 자동화 (Agent 활용)

Claude Code에서 발행 직전에 돌리는 패턴:

Agent({
  description: "XX 본문 팩트체크",
  prompt: "본문의 모든 숫자/시간/무료여부/최상급 표현을 
  공식 출처로 교차 검증해줘. 
  수정 필요한 항목만 표로 정리 + 올바른 정보 + 출처 URL."
})

반드시 본문 발행 직전에 한 번 더 (2차 팩트체크). 1차에서 놓치는 것 반드시 있다.


블로그/책/강의 공통 체크리스트

발행 직전에 이 리스트 훑기:

  • [ ] 모든 숫자에 출처 URL 달려 있나?
  • [ ] 요금·시간은 최근 6개월 이내 자료로 확인?
  • [ ] 무료 → 유료 전환 예정 정보 누락 없나?
  • [ ] "유일", "최고", "최대" 같은 최상급 근거 있나?
  • [ ] 인물 직함·출판 정보 직접 확인했나?
  • [ ] 충돌하는 정보는 두 출처 다 표기했나?
  • [ ] 독자가 "확인 전화 걸 수 있도록" 연락처 남겼나?

주의할 함정

함정 1 — "공식이 말했으니 맞겠지"

공식은 느리다. 정책 바뀌어도 페이지 반영은 몇 달 걸릴 수 있다.

함정 2 — "에이전트가 찾아줬으니 맞겠지"

Agent도 한 번에 실수한다. 2차 Agent 또는 WebFetch 직접 열어서 원문 한 번 더 보기.

함정 3 — "블로그에 다 그렇게 쓰여 있던데"

다른 블로그들은 서로 복붙한다. 1차 출처 아닌 블로그 인용은 팩트체크 아님.

함정 4 — "확실해 보이는 숫자는 체크 생략"

"면적 126,500㎡"처럼 확정적으로 보이는 숫자도 광역(사적 제512호 '대릉원 일원' 602,314㎡)과 협의(대릉원 관광지 126,500㎡) 구분 필요. 좁은 정의/넓은 정의 혼동 조심.


관련 메모리

  • feedback_factcheck.md — 블로그 실전 팩트체크 교훈
  • feedback_factcheck_sources.md — 출판/인용 정보 Goodreads·Wikipedia 확인 원칙
  • feedback_superlative_factcheck.md — 최상급 표현 주의
  • feedback_goleman_lieberman.md — affect labeling 오귀속 사례

학습 히스토리

  • 2026-04-20 대릉원 천마총 포스팅에서 쪽샘 주차장 무료→유료 전환 못 잡을 뻔해서 작성
  • 1차 Agent가 공식 페이지만 확인 → 2차 Agent가 언론 보도 확인 → 충돌 발견 → 사용자 지적 "주차장 확실한 거 맞아?" 덕분에 3차 WebFetch로 직접 재확인