AI 크롤러도 자바스크립트를 실행하나?

대체로 실행하지 않는다. GPTBot, ClaudeBot, PerplexityBot 같은 주요 AI 크롤러는 헤드리스 브라우저로 렌더링하지 않고 초기 HTML만 읽는 경우가 많다. 클라이언트 렌더링(CSR)에만 의존하면 본문이 비어 보일 수 있으므로, 핵심 콘텐츠는 서버 렌더링이나 정적 생성으로 HTML에 담아야 한다.

FAQ 구조화 데이터(FAQPage)를 지금도 넣을 가치가 있나?

리치 결과 목적이라면 가치가 사라졌다. 구글은 2023년 8월 FAQ 리치 결과를 정부·의료 사이트로 제한했고, 2026년 들어 완전히 폐기했다. 다만 명확한 질문-답변 구조 자체는 AI가 콘텐츠를 인용 단위로 잘라 쓰기 좋게 만든다. 스키마 마크업이 아니라 본문의 구조로 접근하는 편이 낫다.

쿼리 팬아웃(Query Fan-out)이 롱테일 키워드와 같은 개념인가?

아니다. 롱테일 키워드는 검색량이 적은 구체적인 검색어를 가리킨다. 쿼리 팬아웃은 검색 시스템이 하나의 질문을 여러 하위 질문으로 쪼개 동시에 검색한 뒤 결과를 합치는 내부 메커니즘이다. 사용자가 입력하는 것이 아니라 AI가 만들어내는 질문들이다.

AI 검색 시대에는 검색 순위가 의미 없나?

여전히 중요하다. AI 오버뷰가 낮은 순위의 문서를 인용하는 경우가 있지만, 색인·랭킹 기반이 부실하면 애초에 후보에 들지 못한다. 순위는 충분조건이 아니라 필요조건에 가까워졌다.

AI가 읽는 웹사이트 만들기: 쿼리 팬아웃·AI 오버뷰 시대의 기술 SEO

검색창에 무언가를 치면 이제 파란 링크 열 개가 아니라 완성된 문단이 먼저 뜬다. 구글 AI 오버뷰가 답을 요약해 보여주고, AI 모드는 아예 대화하듯 후속 질문을 받는다. 사용자는 출처 페이지를 클릭하지 않고도 답을 얻는다.

개발자 입장에서 이 변화는 추상적인 트렌드가 아니다. 우리가 만든 페이지를 읽어가는 주체가 바뀌었다는 뜻이다. 사람을 위해 만든 화면 위에 이제 기계 독자가 한 겹 더 올라왔고, 그 기계는 우리 사이트를 사람과 다르게 읽는다. 이 글은 그 기계를 위해 무엇을 손봐야 하는지 정리한다.

검색이 답을 직접 만들기 시작했다

핵심 메커니즘은 쿼리 팬아웃(Query Fan-out)이다. 구글은 2025년 3월 AI 모드를 발표하면서 이 기법을 소개했고, 같은 해 5월 I/O에서 Gemini 2.5와 함께 확대했다.

동작은 단순하다. “여름 제주도 여행” 한 줄을 받으면 시스템은 이걸 그대로 검색하지 않는다. 먼저 여러 하위 질문으로 분해한다.

제주도 여름 평균 기온과 날씨
여름에 가기 좋은 제주 관광지
제주 여름 숙소
여름 시즌 제주 축제

각 질문을 병렬로 검색하고, 결과를 주제별로 묶은 다음, 출처를 인용하며 하나의 답으로 합친다. 전통적인 검색이 “이 키워드에 가장 맞는 페이지는?”을 물었다면, AI 검색은 “이 질문에 답하려면 어떤 조각들이 필요한가?”를 묻는다.

그래서 인용 단위가 페이지에서 문단으로 내려갔다. AI는 페이지 전체를 순위 매기는 게 아니라, 답변에 쓸 문장과 단락을 골라낸다. 한 페이지가 통째로 1등을 하는 게 아니라, 어떤 페이지의 세 번째 문단만 답변에 박히는 일이 일상이 됐다.

AI 오버뷰도 같은 뿌리다. 2024년 5월 미국에서, 12월에는 한국에서 정식으로 켜졌다. 흥미로운 건 인용 패턴이다. BrightEdge의 2024년 분석을 보면, AI 오버뷰가 거는 링크의 절반 가까이가 자연 검색 50위권 밖 문서였다. 순위 1페이지에 없어도 인용될 수 있고, 1페이지에 있어도 인용 안 될 수 있다. 게임의 규칙이 바뀐 것이다.

AI 크롤러는 자바스크립트를 실행하지 않는다

여기서부터가 개발자의 영역이다. 그리고 가장 자주 무너지는 지점이기도 하다.

구글봇은 오랜 시간을 들여 렌더링 파이프라인을 갖췄다. 자바스크립트를 실행하고, DOM이 그려진 뒤의 결과를 색인한다. 그런데 새로 등장한 AI 크롤러들, GPTBot이나 ClaudeBot, PerplexityBot은 사정이 다르다. 대체로 초기 HTML만 읽고 떠난다. 클라이언트에서 렌더링되는 내용은 그들 눈에 빈 페이지다.

SPA로 만든 사이트가 <div id="root"></div> 하나만 던지고 본문을 전부 자바스크립트로 채운다면, AI 크롤러에게 그 페이지는 사실상 백지다. 사람에게는 멀쩡히 보이는 화면이 기계 독자에게는 존재하지 않는다.

해법은 새롭지 않다. 핵심 콘텐츠를 HTML에 담는 것이다.

서버 사이드 렌더링(SSR)이나 정적 생성(SSG)으로 본문을 미리 그려서 내려보낸다
제목, 본문, 핵심 데이터는 자바스크립트 실행 없이 소스에 존재해야 한다
클라이언트 렌더링은 상호작용을 더하는 용도로 쓰되, 콘텐츠 전달을 거기에만 맡기지 않는다

이 블로그가 Astro로 정적 생성되는 이유도 결국 같다. 빌드 시점에 HTML이 완성되어 있으면, 사람이든 구글봇이든 AI 크롤러든 같은 본문을 읽는다.

기계가 읽을 수 있는 상태를 유지하라

렌더링을 해결했다면 그다음은 접근 자체를 막지 않는 것이다. 당연해 보이지만 실무에서 가장 흔하게 깨진다. 점검 항목은 길지 않다.

robots.txt에서 크롤러를 막고 있지 않은가. AI 크롤러를 의도적으로 차단할 거라면 그건 정책 결정이지만, 모르고 막는 경우가 많다
중요한 페이지가 200으로 응답하는가. 리다이렉트 체인이나 간헐적 5xx가 끼어 있지 않은가
noindex가 실수로 붙어 있지 않은가. 스테이징 설정이 운영에 새어 들어오는 사고가 잦다
canonical이 자기 자신을 가리키는가. 잘못된 canonical은 색인에서 통째로 빠지게 만든다

AI 크롤러 트래픽은 더 이상 무시할 수준이 아니다. AI 검색 서비스들의 크롤링이 구글봇의 30% 규모까지 올라왔다는 관측도 있다. 우리 사이트에 누가 들어오는지 서버 로그를 한 번 들여다볼 때가 됐다.

구조화 데이터: FAQ의 몰락과 그 다음

여기서 원본 마케팅 글들과 가장 크게 갈라진다. 많은 SEO 가이드가 아직도 “FAQ 스키마를 넣어 리치 결과를 얻으라”고 한다. 틀린 조언이다.

구글은 2023년 8월 FAQ 리치 결과를 정부·의료 같은 권위 사이트로 제한했고, 2026년에는 완전히 폐기했다. 일반 사이트가 FAQPage 마크업을 넣는다고 검색 결과에 아코디언이 생기던 시절은 끝났다. How-To 리치 결과도 같은 길을 갔다.

그렇다고 구조화 데이터 전체가 죽은 건 아니다. Article, BreadcrumbList, Product, Organization 같은 타입은 여전히 유효하고, AI가 페이지의 정체를 파악하는 단서로도 쓰인다. JSON-LD로 schema.org 표준을 따르는 것이 기본이다.

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "Article",
  "headline": "AI가 읽는 웹사이트 만들기",
  "datePublished": "2026-06-16",
  "author": { "@type": "Person", "name": "주진현" }
}
</script>

한 가지 원칙만 지키면 된다. 마크업에 적은 내용은 화면에 실제로 보이는 텍스트와 일치해야 한다. 보이지 않는 정보를 구조화 데이터로만 슬쩍 끼워 넣는 건 가이드라인 위반이고, 적발되면 신뢰를 잃는다. 작성한 마크업은 Rich Results Test로 검증하는 습관을 들이자.

스키마보다 더 효과가 큰 건 본문 구조 자체다. AI가 문단을 인용 단위로 가져간다는 걸 기억하면 글 쓰는 방식이 달라진다.

질문형 소제목을 쓰고 결론을 문단 첫 문장에 둔다. 두괄식은 AI가 답을 잘라 쓰기 좋은 형태다
“A는 B다” 같은 정의 문장을 명확히 박아둔다. 이런 문장이 그대로 인용된다
가장 중요한 답은 페이지 위쪽에 배치한다

속도와 안정성도 신뢰 신호다

AI 모드는 모바일 환경에서 콘텐츠를 바로 렌더링해 보여준다. 느리고 불안정한 페이지는 사람에게도, 그 위의 기계에게도 감점이다.

Core Web Vitals 세 지표는 그대로 챙겨야 한다. LCP(가장 큰 요소가 그려지는 시간), INP(상호작용 반응성, 2024년 3월부터 FID를 대체했다), CLS(레이아웃이 흔들리는 정도). 서버 응답 속도(TTFB)도 안정적으로 유지하는 게 좋다.

이미지와 영상에는 의미 있는 alt 텍스트와 캡션을 붙인다. 멀티모달 검색에서 이미지를 이해하는 통로가 거기다. 장식용이 아니라 정보 전달용 이미지라면 설명을 빼먹지 말자.

AI에게 맡길 수 없는 것

기술을 다 갖췄다고 콘텐츠까지 자동화되는 건 아니다. 이 지점에서 솔직해질 필요가 있다.

AI는 페이지를 대량으로 찍어낸다. 지점 200곳의 “지역+업종” 페이지, 제품 비교 페이지, 데이터 기반 설명문. 반복적이고 패턴이 분명한 작업에는 분명 강하다.

문제는 검색 의도다. “청약 해지 방법”과 “청약 해지 불이익”은 한 글자 차이지만 사용자가 원하는 답이 완전히 다르다. 전자는 절차를, 후자는 위약금을 알고 싶어 한다. AI는 이 미묘한 차이를 자주 놓치고, 그 결과 지역명만 바꾼 얄팍한 페이지(thin content)를 양산한다. 구글은 이런 중복 콘텐츠를 좋아하지 않는다. 페이지를 수백 개 찍어도 색인은 오히려 줄어든다.

도메인 신뢰도도 돈으로 못 산다. 신생 사이트가 하루아침에 AI 생성 페이지 수천 개를 쏟아내면, 구글은 그걸 인덱싱하지 않는다. 의료·금융·법률처럼 전문성이 요구되는 분야에서는 E-E-A-T(경험·전문성·권위·신뢰)가 더 무겁게 작동하고, 실제 전문가의 경험을 AI가 대신 써줄 수는 없다.

그러니 역할을 나누는 게 맞다. AI는 속도와 규모를, 사람은 깊이와 판단을 맡는다. 자동화는 도구고, 무엇을 왜 만들지는 여전히 사람이 정한다.

정리하면

AI 검색에 대응하는 기술 SEO는 결국 하나의 질문으로 수렴한다. 우리가 만든 페이지를 기계가 제대로 읽을 수 있는가.

자바스크립트 없이도 본문이 보이고, 크롤러를 막지 않고, 구조화 데이터가 화면과 일치하고, 빠르게 뜬다면 절반은 됐다. 나머지 절반은 인용할 이유가 있는 콘텐츠를 사람이 쓰는 일이다. 새로운 마법은 없다. 다만 오래된 기본기가 그 어느 때보다 직접적으로 보상받는 시대가 됐을 뿐이다.