이커머스에서 가장 중요한 사용자 리뷰! 사용자 리뷰 내 특정 키워드 관련 표현을 스마트하게 찾고, 하이라이팅 정보를 제공하는 ML모델 개발하여 서비스에 반영하였습니다. 복잡한 전처리와 모델링전반의 프로세스를 Amazon SageMaker + Custom Docker 로 구현 방법을 소개합니다.
14. Image
Text
1)
2)
전처리(Tokenization, text Cleaning)
유사 키워드 데이터셋 구축
키워드 분류 모델 학습
긍/부정 분류 모델 학습
1) "Why Should I Trust You?": Explaining the Predictions of Any Classifier(Marco Tulio Ribeiro and Sameer Singh and Carlos Guestrin, 2016)
2) http://ndcreplay.nexon.com/NDC2018/sessions/NDC2018_0033.html
classifier
LIME
Explainer
15. 전처리(Tokenization, text Cleaning)
유사 키워드 데이터셋 구축
키워드 분류 모델 학습
긍/부정 분류 모델 학습
뱃살 잘 가려주고 얇아서 시원해요. 배송도 진짜 빨라요
배송 진짜 하루만에 왔어요. 근데 린넨이라 접힌자국이 있네요
종류 다양하고 배송도 진짜 빠른데 가격은 좀 있는거같아요
목요일 밤에 주문했는데 진짜 금요일에 왔어요
석유냄새 좀 나는거 빼고는 만족해요
긍정
부정
부정
부정
Distilbert
16. 전처리(Tokenization, text Cleaning)
유사 키워드 데이터셋 구축
키워드 분류 모델 학습
긍/부정 분류 모델 학습
이 제품은 후기가 거의 없어서 반신반의하며 샀는데 대만족이에요!! 두께는 얇아서 겨울 제
외하고는 다 입기 좋을 것 같아요~~ 코튼 재질이라 보들보들하니 촉감도 좋고
무엇보다 저는 색상이 넘넘 맘에 듭니다. 배송만 좀 더 빠르면 좋을 것 같아요~
이 제품은 후기가 거의 없어서 반신반의하며 샀는데 대만족이에요!!
두께는 얇아서 겨울 제외하고는 다 입기 좋을 것 같아요~~
코튼 재질이라 보들보들하니 촉감도 좋고 무엇보다 저는 색상이 넘넘 맘에 듭니다.
배송만 좀 더 빠르면 좋을 것 같아요~