RSS Feed의 구조는 대부분 비슷해요. 하지만 제공자마다 RSS Feed 내 요약된 내용을 넣을 수도 있고, 아니면 전체 내용을 넣을 수도 있어요. 하지만 공통적으로 본문을 볼 수 있는 링크가 포함되어 있어요. N8N을 통해 RSS Feed 내 Link로 들어가 본문 내용을 추출해 볼게요.
이전 글에서 뉴스 RSS Feed 자체를 저장하는 글을 썼었어요.
하지만 RSS Feed에 요약된 기사 내용을 넣는 경우가 대부분이고 전체 내용은 피드 내 링크를 타고 들어가야지 볼 수 있어요.
이번 글에서는 RSS 피드 내 링크에 있는 본문 내용을 추출하도록 해보도록 할게요.
이전 글 참고
2025.09.04 - [N8N] - N8N 사용법 - 워크플로우(Workflow) 개념과 뉴스 RSS 피드 엑셀 저장
개요
이번 글의 목표는 RSS 피드에서 뉴스 항목을 꺼내고,
각 기사 페이지의 본문을 추출한 다음 XLSX로 저장하는 거예요.
워크플로우 흐름은 아래와 같아요
“피드 요청 → XML→ JSON 변환 → 피드 Link 추출 → 순차적 실행 [ 본문 페이지 요청 → HTML 내 텍스트 추출 ] 완료 후 → 엑셀 저장”
여기서 HTML 내 텍스트 추출을 담당하는 WebpageContentExtraction은 커뮤니티 노드예요.
제가 작성한 커뮤니티 노드 관련 글을 참고하여 설치해 주세요
패키지 이름은 n8n-nodes-webpage-content-extractor 예요.
2025.09.10 - [N8N] - N8N Guide - 커뮤니티 노드(Community Node) 설치
N8N Guide - 커뮤니티 노드(Community Node) 설치
N8N Community Node는 커뮤니티가 만들어 배포하는 확장 노드예요. 공식 노드에 없는 서비스·API를 연결하거나, 기존 기능을 더 편하게 쓰도록 도와줘요. 개발자가 아니어도 클릭 기반으로 설치·활용
knockknows.com
워크플로우 가져오기
먼저 위의 Workflow JSON 파일을 다운로드하여주세요.
n8n 워크플로우 캔버스(workflow canvas)에서 좌측 상단의 (...)을 누르고 'Import from File...'을 선택해요.
탐색기 창이 나타나면 제가 위에 첨부한 JSON 파일을 선택해서 업로드해요.
그럼 위에서 본 워크플로우 화면의 노드들이 그대로 캔버스에 그려져요.
노드 동작 흐름
이 워크플로우의 노드는 총 8개로 구성되어 있어요.
동작 흐름은 아래와 같아요.
1) Manual Trigger
테스트를 쉽게 하기 위한 수동 시작점이에요.
콘솔에서 Execute Workflow를 눌렀을 때만 실행돼요.
실제 운영에서는 Cron이나 Webhook 트리거등으로 교체할 수 있어요.
보통 Cron을 쓸 텐데 매일 오전 9시에 워크 플로우를 동작하게 하는 등 다양하게 시작점을 설정할 수 있어요.
2) HTTP Request — RSS
RSS 피드를 HTTP GET으로 받아오는 노드예요.
RSS Feed URL만 정확히 넣으면 피드 본문을 알아서 받아와요.
저는 예시로 Bleeping Computer News의 RSS Feed를 받아오도록 설정헀어요.
성공적으로 받아오면 아래 이미지의 우측과 같이 XML 데이터 본문이 OUTPUT으로 출력돼요.
3) XML → JSON
XML 노드를 통해 XML을 JSON으로 변환해요.
이유는 N8N에서는 JSON 객체를 쉽게 다룰 수 있기 때문이에요.
성공하면 위와 같이 우측 OUTPUT에 XML 데이터가 JSON으로 변환되어 나타나요.
4) Split Out — item 분리
rss.channel.item
배열을 개별 아이템으로 쪼개요.
이렇게 해야 각 뉴스 항목을 순차적으로 별도 레코드로 가공할 수 있어요.
그래서 현재 글을 쓰는 시점에서 RSS 피드 내 있던 Item 총 12개가 추출됐어요.
이들은 다음 노드에서 순차적으로 본문 링크로 접속해서 내용을 추출해요.
5) Loop Over Items — 배치 처리
Loop Over Items는 많은 데이터를 배치, 즉 순차적으로 조금씩 처리하기 위해 사용하는 노드예요.
지금 글을 쓰는 시점에는 12개의 아이템이지만 여러분들이 더 많은 데이터를 다룰 때는 수백, 수천 개가 넘는 데이터를 다룰 수도 있어요.
이들을 한 번에 처리하려면 그만큼 N8N을 실행하는 호스트 스펙이 좋아야 해요.
저는 셀프 호스팅으로 아주 낮은 스펙은 가진 VPS에 동작 중이기 때문에 배치처리를 하도록 할게요.
노드를 실행하면 아래 이미지와 같이 좌측에 있던 여러 Item 중 한 개만 OUTPUT으로 빠져나와요.
순차적으로 모든 Item이 처리될 때까지 반복돼요.
모든 Item의 처리가 완료되면, 처리된 Item들의 Output들을 합쳐서 Done 부분으로 전달해요.
Loop Over Items 공식 링크
https://docs.n8n.io/integrations/builtin/core-nodes/n8n-nodes-base.splitinbatches/
Loop Over Items (Split in Batches) | n8n Docs
Integrations Built-in nodes Core nodes Loop Over Items The Loop Over Items node helps you loop through data when needed. The node saves the original incoming data, and with each iteration, returns a predefined amount of data through the loop output. When t
docs.n8n.io
6) HTTP Request — 본문 페이지
Loop Over Items 노드를 통해 1개의 Item을 Input으로 전달받아요,
Item 항목 내 link
URL을 이용해 본문 페이지를 요청해요.
그럼 우측 OUTPUT에 HTML 데이터가 나타나요.
7) Webpage Content Extractor
기본적으로 제공되지 않는 커뮤니티 노드예요.
개요 항목에서 보셨다시피 설치하지 않으면 사용할 수 없어요.
이 노드는 HTML에서 본문 텍스트 정보를 추출해요.
WebPage Content Extractor Github 링크
https://github.com/Savjee/n8n-nodes-webpage-content-extractor
GitHub - Savjee/n8n-nodes-webpage-content-extractor
Contribute to Savjee/n8n-nodes-webpage-content-extractor development by creating an account on GitHub.
github.com
8) Convert to File — XLSX 저장
Loop Over Items의 Done에 연결되어 있어요.
이 노드는 앞서 순차적으로 처리되었던 Loop Over Items의 모든 결과를 합친 데이터를 Input으로 받아요.
동작 결과 확인
동작이 완료되면 아래와 같이 워크플로우 캔버스 내 선 색이 변해요.
Loop Over Items 부분을 보시면 12 Items가 Covert to File로 전달된 것을 볼 수 있어요.

생성된 엑셀을 보시면 피드 내 링크의 본문 내용을 가지고 와서 저장된 것을 확인할 수 있어요.

정리
이전 글에 있었던 단순히 RSS Feed 데이터만 저장하는 것에서
피드 내 본문 정보까지 가지고와서 엑셀(XLSX)로 저장해 봤어요.
하지만 이 워크플로우에서는 몇 가지 개선점이나 단점이 있어요.
- Loop Over Items에서 너무 빨리 순차적으로 동작하다보면 웹에서 봇으로 인식해서 차단될 수 있어요.
중간에 Wait 노드를 넣어서 지연을 넣어주는 것도 좋아요. - HTTP Request / WebpageContentExtraction는 자바 스크립트 동작을 통해 컨텐츠가 표시되는
동적 렌더링 페이지에서는 정상적으로 컨텐츠를 추출할 수 없어요.
대표적으로 2개만 적었지만, 더 많은 단점이 있을 수 있어요.
위 워크플로우를 사용한다면, 테스트를 통해 문제점을 확인 후 보완하는 것이 좋아요.
'N8N' 카테고리의 다른 글
N8N Guide - 커뮤니티 노드(Community Node) 설치 (0) | 2025.09.10 |
---|---|
N8N 사용법 - HTTP Request 노드 및 HTTP 메소드 이해 (0) | 2025.09.08 |
N8N 사용법 - 워크플로우(Workflow) 개념과 뉴스 RSS 피드 엑셀 저장 (0) | 2025.09.04 |
N8N 사용법 - 인터페이스 소개 (0) | 2025.09.03 |
N8N 셀프 호스팅 구축기 (5) - CloudFlare Domain + Hetnzer VPS + Docker Compose + N8N (하) (5) | 2025.08.29 |