Data science/자연어처리

[자연어처리] 3. RNN 개념 이해

endingo 2025. 4. 12. 20:24

1. RNN

개념: 시간 순서가 있는 데이터를 처리하는데 유리하다.

특징:

- 이전의 정보를 순환하면서 계속 유지하면서 쌓아가는게 특징

- Hidden State: 현재까지 정보를 축적해서 다음 셀로 넘기는 역할

- Weight Sharing: 모든 단어를 처리할 때 같은 가중치를 사용해서 계산

- 과거의 정보를 현재에 반영해 학습하도록 설계

구조: RNN 일반적인 신경망과 달리 출력을 다시 입력으로 넣는 구조

장점: 순차 데이터에 강함, 과거 정보를 기억하면서 처리가능

한계: 긴 문장에서는 기억력이 약함, 단기기억 문제

해결책: LSTM, GRU같은 개선된 RNN 모델

 

2. RNN 모델링 절차

- 데이터 분할 1: x, y

- 스케일링: 

- 3차원 데이터셋 만들기: timesteps 단위로 잘라서 sliding window 

- 데이터 분할: train, val