'Data science/RAG' 카테고리의 글 목록

[RAG] 2. 벡터 DB구성과 RAG 파이프라인 구축2

1. Vector DB 구성 1) Loader- PDF Loader: LangChain에서 PDF 문서를 불러와 RAG 시스템에 사용할 수 있도록 변환하는 도구from langchain.document_loaders import PyMuPDFLoader# PDF 파일 로드pdf_path = "2025년 사이버 위협 전망 보고서.pdf"pdf_loader = PyMuPDFLoader(path + pdf_path)# 문서 로드 실행documents_pdf = pdf_loader.load()# 출력 확인print(f"총 {len(documents_pdf)} 개의 페이지가 로드됨") - csv 로더: 각 행을 하나의 Document 객체로 변환data = pd.read_csv(path+'sample.csv')d..

Data science/RAG 2025. 5. 1. 00:36

[RAG] 1. 벡터 DB 구성과 RAG 파이프라인 구축

1. Vector DB 구성 1) Vector DB 정의: 대규모 텍스트 데이터 및 임베딩 벡터를 저장, 검색용 2) Vector DB 과정텍스트 추출: Loader다양한 문서로부터 텍스트 추출하기 = > 텍스트 분할: Splitterchunk 단위로 분할Document 객체로 만들기 => 텍스트 벡터화: Text Embedding => Vector DB로 저장: Vector Store 2. 벡터 디비 구성과정 1) Loader다양한 소스에서 문서를 불러오고 처리하는 과정을 담당 from langchain.document_loaders import TextLoader# 텍스트 파일 경로 지정file_path = "상록수.txt"# TextLoader를 이용하여 문서 로드loader = TextLoa..

Data science/RAG 2025. 4. 30. 23:00

이전 1 다음

이전 다음

공지사항

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

TAG more

« 2026/04 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30

글 보관함

안녕하세요, SW 엔지니어 이정훈입니다

기술 스택

자격증

주요 프로젝트

대외 활동

상

채널

이정훈 블로그

👨‍💻 이정훈 개발자

티스토리툴바