<del id="raj44"><thead id="raj44"></thead></del>
          1. <var id="raj44"></var>

              基于sklearn庫,搭建一個簡單的問答系統

              日期: 2018-12-06 09:22:57 / 人氣: 3229

              第一部分: 在這部分里,首先需要去讀取給定的文件,并把文件里的內容讀取到list里面。這部分的任務主要需要文件IO操作方面的基本知識。


              第二部分: 處理已有的字符串數據,并把它們轉換成詞袋向量。這部分內容涉及到一些簡單的字符串預處理技術(比如過濾掉一些沒用的字符、分詞等),還有就是基于sklearn的把字符串轉換向量的過程。本部分的內容需要字符串操作、分詞、詞袋模型相關的基礎知識。

              部分: 對于用戶的新輸入,返回答案。 這是最后一部分,也就是等盈彩网創建完詞袋向量之后,盈彩网就可以輸入一些新的問題,然后從庫中找出最合適的答案。這部分的任務涉及到余弦相似度、簡單搜索排序等方面基礎知識。

              輸入問題,查看結果


              print(answer("誰知道網上找兼職工作的網站"))

               
              搜索結果如下:

              這里沒有對返回數據進行過清洗,否則體驗會更好一些…

              --------------------- 
              作者:簡單隨風 
              來源:CSDN 
              原文:blog.csdn.net/lt326030434/article/details/82909589 


              盈彩网