112年_艾鍗學院_數據分析暨機器學習應用班
組長:16郭O展
組員:01王O、02李O、20林O
專題網頁:https://bit.ly/3RTkyMc
艾鍗官網:https://bit.ly/3ESwHdW
聯絡信箱:service@ittraining.com.tw
<專題摘要>
我們目標是從Youtube的影片內容中找出有關化妝品的關鍵字。以便瞭解在投放廣告時能夠精準地下關鍵字提高績效,再透過第三方生產的文章比對相似性是否符合市場趨勢。
我們由爬蟲將Youtube影片的網址儲存到sqlite3中,使用whisper api 將影片內容轉成繁體中文儲存到sqlite3,接著將原始資料輸入中研院CKIP斷詞工具運算,再利用tfidf剔除多餘的的贅詞,找出重要關鍵字。另外也比較熱搜關鍵字用n-gram篩選排序,找出關鍵字重要程度。
最後,小編將利用篩選出重要關鍵字寫出的文章和資料庫裡的資料對比,產出相似度報告與關鍵字建議,結合Open AI API自動生成客製化優質文稿。