728x90
μμ°μ΄ μ²λ¦¬μ νμ©λΉλκ° κ°μ₯ λμ μ±λ΄μ λ§λ€μ΄ λ³Έλ€. λ¨μνκ² κ·μΉ κΈ°λ°μΌλ‘ μ μ, λ¨Έμ λ¬λ μ μ¬λ νμ© λ± λ€μν λ°©λ²μ΄ μμ§λ§ λ₯λ¬λμ ν΅ν΄ μ€μ΅μ νλ€. λ₯λ¬λμμλ Sequence to sequence λͺ¨λΈμ νμ©ν΄ μ±λ΄μ μ μνλ λ°©λ²μ μ¬μ©νλ€.
Data : github.com/songys/Chatbot_data
( http://cafe116.daum.net/_c21_/home?grpid=1bld )μμ μμ£Ό λμ€λ μ΄μΌκΈ°λ€μ μ°Έκ³ νμ¬ μ μ
μλ£λ₯Ό μ€νμΌλ‘ μ 곡ν΄μ£Όμ songysλκ» κ°μ¬ν©λλ€.
- μ±λ΄ νΈλ μ΄λμ© λ¬Έλ΅ νμ΄ 11,876κ°
- μΌμλ€λ°μ 0, μ΄λ³(λΆμ ) 1, μ¬λ(κΈμ ) 2λ‘ λ μ΄λΈλ§
import pandas as pd
FILE = 'ChatbotData .csv'
data = pd.read_csv(PATH+FILE,encoding='utf-8')
data.head()
# Q A label
# 0 12μ λ‘! νλ£¨κ° λ κ°λ€μ. 0
# 1 1μ§λ§ νκ΅ λ¨μ΄μ‘μ΄ μλ‘ν΄ λ립λλ€. 0
# 2 3λ°4μΌ λλ¬κ°κ³ μΆλ€ μ¬νμ μΈμ λ μ’μ£ . 0
# 3 3λ°4μΌ μ λ λλ¬κ°κ³ μΆλ€ μ¬νμ μΈμ λ μ’μ£ . 0
# 4 PPL μ¬νλ€ λμ΄μ΄ μ°νΈλ €μ§μ£ . 0
- λ¬Έμ₯ λ¨μμ κΈΈμ΄ λΆμ
- λ¨μ΄ λ¨μμ κΈΈμ΄ λΆμ
- ννμ λ¨μμ κΈΈμ΄ λΆμ
# μ§λ¬Έ λ¬Έμ₯κ³Ό λ¨μ΄ λ¬Έμ₯μ νμ¬ λΉμ¨
λ°μν
'π£οΈ Natural Language Processing' μΉ΄ν κ³ λ¦¬μ λ€λ₯Έ κΈ
μ μ¬ λν΄λ ν λΉ (LDiA, Latent Dirichlet Allocation) (0) | 2021.02.17 |
---|---|
[Kaggle] λ€μ΄λ² μν 리뷰 λΆλ₯(2) (0) | 2021.02.17 |
MaLSTM (0) | 2021.02.13 |
[Kaggle] λ€μ΄λ² μν 리뷰 λΆλ₯(1) (0) | 2021.02.12 |
PCA, SVD μ μ¬ μλ―Έ λΆμ (0) | 2021.02.11 |