“還沒有。老師給了我一本關於情感分析的書,我準備先學習一下。”
情感分析啊,淩誌有所了解。
早年的情感分析基本上是將文本分為積極、消極以及中性三類。
早在十幾年前,相關的論文就已經不計其數。大家爭先恐後地在各大會議上發表,並聲稱自己在公開數據集上取得了最優的效果,儘管分類準確率可能隻是零點幾個百分點的提升。
如今,這個任務的情感分析準確率早已被刷到了97%以上,再也沒人在這個任務上浪費時間了。
如今大家做的情感分析會更細粒化。如將一句話的情感分為喜怒哀懼等多個類彆,看看在哪一種類彆上的得分最高,那麼這句話就更偏向於哪類情感。
而多分類任務一般的準確率相對較低,在以前可能也就將將過50%。如今這個任務已經有人做到了0%以上,所以更多的,人們開始進一步將任務細粒化。
比如開始分析一句話中的情感到底是喜悅,還是假裝喜悅,是恐懼,還是裝作恐懼。由此帶來了一串相關研究任務,如情感方麵詞提取,情感原因匹配對抽取等等。
淩誌雖然不做這個研究方向,但是在入學時也有看過這類的書籍。
想要做情感分析的話,確實比較容易上手,不過想做出好成果,並不容易。
跑模型大家都會,但想要做出新意,效果超過其他所有人,可能付出的努力並不一定會比自己小。“哦,挺好的,這個方向挺好上手的。有什麼問題我們也可以交流,我以前也了解過一些情感分析的知識。”
“好啊,謝謝師兄。那師兄做的是什麼研究方向呢”
“哦,我呀,我做的是用戶身份識彆算法,就是根據用戶的文本寫作風格來判斷兩個賬戶是不是屬於同一個人。……”
淩誌簡單介紹了一下自己的研究方向,隻不過沒有贅述自己遇到的困難,隻是簡單說了聲自己沒有什麼重要進展。
“總之現在還是在調模型,大概就是這樣。”
韓輕悅在整個過程中都仔細聽著,沒有發出一絲聲音,哪怕是“嗯”的讚同聲都沒有。
“嗯,師兄做得很好啊。這個課題應該很難拿到真實數據集的吧,據說現在的水軍賬號識彆率,也隻有0.9%,遠遠低於預估,更彆說賬號關聯了。”
淩誌感覺有些異樣,不過他先壓下心中的疑惑,感謝道:
“嗯,謝謝你能這麼說。數據集雖然拿不到真實的,但是還是可以模擬一份數據集做下去。目前的實驗狀態已經漸漸好轉了,堅持做下去肯定會更好。”
淩誌稍微猶豫了一下,補充道:
“不過,你剛剛說的水軍賬號識彆率,是從哪裡得到的消息這麼準確的數字,我都不知道。”
韓輕悅臉上的微笑消失了一瞬,但隨即又恢複成了原來的樣子,說道:
“哦,那個啊,我也忘了,不知道以前從網上哪個角落讀取到的信息,師兄不用在意。”
“這樣啊。不過不管怎麼說,好歹你又幫我增加了一個知識點,謝謝你。”
“沒事的,倒是我要謝謝師兄。”
“嗯,還有什麼想問的嗎”
“嗯……暫時沒有了,那師兄,以後有機會再聊。”
“好。”
韓輕悅站了起來,慢慢走向其他人的座位,甚至3個男生新生都沒有錯過。但無論是誰,她的隻言片語中都會有幾個字飄向淩誌的耳中:
“你好……輕盈的輕,喜悅的悅。……”
真是少見的求知欲如此旺盛又如此禮貌的姑娘啊。淩誌想道。
3個男生新生也在跟附近的師兄師姐交流,但並不是每個人都有聊到,這一下子就顯得韓輕悅與眾不同。
而因為她的謙遜禮貌,不多時便贏得了不少人的好感。淩誌遠遠地聽見周敏師兄開始跟韓輕悅開玩笑了:
“哎,師妹,你看你要是做情感分析做不下去,就轉到我們這邊來吧。我們跟老王深耕多年,還算有不少經驗,到時候罩著你啊,哈哈。”
韓輕悅依然不卑不亢地微笑著說道:
“謝謝師兄,我會考慮的。”
淩誌無奈地笑著搖了搖頭,他想起自己去年剛到實驗室的時候那份局促不安的樣子:隻敢待在自己的座位上,連倒杯水都要躡手躡腳的,更彆說主動去了解其他師兄師姐做的方向,他怕暴露自己的無知。所以眼前韓輕悅的舉動讓他很是羨慕。
“哎,輕悅,中午跟我們一起去吃飯吧,怎麼樣”
張小欣師姐已經開始認姐妹了。不過也是,長期以來實驗室一直是陽盛陰衰,好不容易來了個姑娘,當然要把她拉過來站在統一戰線。
“哦,師姐,不好意思,我還有彆的事,就不跟你們一起去了。”
“這樣啊,沒事沒事,你忙你的。”
張小欣似乎有些遺憾,但還是表示理解。
過了一會兒,韓輕悅被拉到了實驗室微信群裡。不久,淩誌收到了韓輕悅的微信好友驗證消息:
“你好,師兄,我是韓輕悅,以後請多指教啊。”(www.101novel.com)