Utopia人工智慧可判斷不同社群平臺上的仇恨言論數量

赫爾辛基--(美國商業資訊)--據芬蘭司法部委託Utopia Analytics進行的一項研究,網上仇恨言論最容易出現在論壇上。該報告發現,97%的已識別仇恨言論訊息來自於論壇。隨後的平臺類型是占2.5%的Twitter訊息和占0.2%的Instagram訊息。而網誌、新聞評論和公開的Facebook訊息占所有已識別仇恨言論的比例不到0.02%。這些資料集不包括私人討論,如Facebook群組或帳戶。

該專案是芬蘭司法部 “Facts Against Hate”計畫的一部分,旨在測試人工智慧在網路環境中識別仇恨言論的能力。該方法結合人類評估與機器學習。專案的關鍵目標是找到仇恨言論的主要通路,並識別平臺之間的差異。

仇恨言論的定義是根據社會科學的學術研究結果。該定義以如下過程完成:首先確定仇恨言論的類別,然後使用類別資料在網路訊息資料集中人工識別出仇恨言論的例子。這些標註隨後被用作Utopia AI Moderator的訓練資料,這是利用文字分析和機器學習且與語言無關的工具。該專案的資料集由2020年9月至10月以芬蘭文發表的1,200萬條線上評論和貼文構成。

結果顯示,芬蘭公開的社群媒體平臺上每月出現大約15萬條包含仇恨言論的訊息,約占所有訊息的1.8%。

在國際公共社群媒體平臺中,Twitter似乎最為突出,有7,450條訊息被認定為仇恨言論,占所有推文的0.14%。轉發在傳播這些訊息中扮演重要角色:所有仇恨言論推文中有39%是重複的。

Utopia執行長Mari-Sanna Paukkeri博士表示:「儘管資料集主要由芬蘭文訊息構成,但其他語言中的結果也會非常相似。例如,芬蘭仇恨言論的主要平臺Ylilauta其實就是大家都熟知的4chan的芬蘭版。此外,只需要兩週,我們就可以建立類似的人工智慧模型來識別其他任何語言中的仇恨言論。只需要一位具備相關技能的專業人員告訴我們該文化和語言中如何定義仇恨言論即可,我們需要具體資料來進行分析。」

媒體庫/照片:https://utopiaanalytics.com/media-library

原文版本可在businesswire.com上查閱:https://www.businesswire.com/news/home/20210422005039/en/

免責聲明:本公告之原文版本乃官方授權版本。譯文僅供方便瞭解之用,煩請參照原文,原文版本乃唯一具法律效力之版本。

最新生活新聞
行動版 電腦版