728x90
반응형

2024/12 2

[pytorch] 시퀀스-투-시퀀스(seq2seq)

seq2seq의 기본 구조와 작동 원리Sequence-to-Sequence(seq2seq) 모델은 한 시퀀스를 다른 시퀀스로 변환하는 신경망 모델입니다.예를 들어, "안녕하세요"라는 한국어 문장을 "Hello"라는 영어 문장으로 번역하는 것처럼, 입력 시퀀스를 받아서 다른 형태의 출력 시퀀스를 생성합니다.인코더(Encoder)-디코더(Decoder) 아키텍처seq2seq 모델은 크게 두 부분으로 구성됩니다.인코더 (Encoder)인코더는 입력 시퀀스를 처리하여 컨텍스트 벡터(Context Vector)를* 시퀀스: 시간적 순서 또는 일정한 순서에 따라 배열된 데이터의 집합을 의미함. 이는 데이터가 순차적으로 의존관계를 가지며, 앞뒤의 데이터가 서로 연결되어 있는 경우를 말함. 예를 들어, 문장, 음성, ..

pytorch 2024.12.31

[pytorch] 코사인 유사도(Cosine Similarity) | 유클리드 거리 (Euclidean Distance) | 자카드 유사도(Jaccard Similarity) | 코사인 유사도를 이용한 영화 추천 시스템 | cosine_similarity

앞서 TF-IDF (Term Frequency-Inverse Document Frequency)를 사용하여 텍스트 데이터를 벡터화하는 방법을 배웠습니다. 이제, 이 TF-IDF 벡터를 활용하여 문서 간 유사도를 계산해보려 합니다. 텍스트 데이터의 유사도를 측정하는 방법으로는 여러 가지가 있지만, 이번에는 코사인 유사도 (Cosine Similarity), 유클리드 거리 (Euclidean Distance), 그리고 자카드 유사도 (Jaccard Similarity)를 사용하여 영화 추천 시스템을 구축해 보겠습니다. 유클리드 거리 vs 코사인 유사도 vs 자카드 유사도 비교기준유클리드 거리(Euclidean Distance)코사인 유사도(Cosine Similarity)자카드 유사도(Jaccard Simi..

pytorch 2024.12.01
728x90
반응형