透視搜尋引擎谷歌演算法存在偏見(完)

2020年03月17日 | 要聞

2018年11月1日，Google員工就公司包庇性騷擾案件，進行罷工。（BRYAN R. SMITH/AFP via Getty Images）

【記者楊傑凱／報導】

前言：谷歌（Google）和臉書（Facebook）等科技巨擘，可能會操縱演算法來影響使用者的認知、觀感態度，甚至投票傾向嗎？搜尋結果的排名又如何影響中間選民呢？在瀏覽網頁的背後，搜尋演算法對我們的行為到底產生多大的影響？

英文《大紀元時報》資深記者楊傑凱（Jan Jekielek）2019年9月專訪《今日心理學》雜誌的前主編羅伯特．愛潑斯坦（Robert Epstein），討論上述問題。以下為訪談內容：

「機器學習公平演算法」

楊傑凱：我也覺得這令我毛骨悚然。現在大量研究顯示，程式開發者的意識形態偏見會被納入演算法。那可能需要在另一次訪談來專門探討。但是谷歌如何抵消這種影響？假設他們決定以您希望的方式做出回應，但要如何做呢？他們是否必須對搜尋進行重新排序，以免出現偏見？這又要如何運作呢？

愛潑斯坦：幾個月前我還在思考這個問題，但現在已有答案。這要感謝揭密的前谷歌員工沃瑞斯（Zach Vorhies），感謝他公布的一些文件。事實上，谷歌可以輕鬆解決搜尋結果中的政治偏見，那我怎麼知道呢？因為谷歌內部一直都在解決所謂演算法不公平或相關的困難問題，所以谷歌開發了一系列使演算法較公平的方法，稱為「機器學習公平演算法」（ML Fairness Algorithms）。

簡單介紹一下該演算法的原理，假設你正在谷歌上瀏覽圖片，然後輸入「CEO」（執行長），你會主要看到男性的圖片，因為絕大多數美國的CEO是男性。這正是某些人稱谷歌演算法不公平的一個具體例子。即使目前大多數的執行長都是男性，但這個事實可能會讓某些人不開心。

因此，他們開發了非常簡單的方法來彌補，當您輸入「CEO」時，您會看到一半是男性，一半是女性。這做法很聰明，當然並不一定符合真實情況，但可以被視為社會工程（social engineering），因為它產生的印象並不完全符合真實情況。當然，如果將這種邏輯應用於社會各層面，則你可能在進行大規模社會工程，或可能被指控在從事大規模社會工程。

我想表達的重點是，谷歌有能力消除任何可能的政治偏見，他們可以很快做到，也許一天之內就可以。這就是我在思考，如果我們透過大型監視系統暴露各種偏見，谷歌公司可能會退縮，他們可能會使用已經開發的技術，即所謂的機器學習公平性演算法來彌補這個問題。下次我們尋找偏見時，就什麼也找不到，問題已消失。

臉書的操作手法

楊傑凱：您不僅說明了問題，還提出可能的解決方案，實屬難得。那請問目前其他搜尋引擎的操控方法，例如大型社群平台臉書又如何呢？他們採用何種演算法呢？

愛潑斯坦：臉書至少有5種影響人們意見和投票傾向的方法。我最早是在2016年寫過這類文章。他們最簡單的方法稱為「定向消息傳遞」，我在一定程度上研究和量化過這個問題，我稱之為「目標消息傳遞效應」（targeted messaging effect，TME），舉個最簡單的例子，順帶一提，這是基於臉書2012年自己發布的數據。

如果在2016年選舉日，祖克柏（Mark Zuckerberg，臉書執行長）決定僅向民主黨選民或偏左的選民發送「去投票」的提示，那一天希拉蕊．柯林頓的投票數將比她當天實際得票多至少45萬。那因為祖克伯偏左，我猜他可能因為沒有想到要發出針對性的訊息而懊惱。但關鍵是，他有能力那樣做，定向消息傳遞有非常強大的影響力。

在2018年，谷歌確實在其首頁上發布了「去投票」的提醒，他們將主頁上彩色的「Google」換成「Go Vote」。如您所知，我發表了一篇文章，其中包含所有計算結果，文中表明如果這個投票提示發送給每個美國人，那麼會有更多人投票，否則這些人將待在家裡。但是由於使用谷歌的人群分布的原因，民主黨獲得的票數將比共和黨獲得的票數多80萬，聽起來是很多選票，但這是期中選舉，因此，這些選票分散在數百個選舉中。儘管如此，這還是有利於民主黨。毫無疑問，在谷歌發布提示之前，谷歌的數據分析師所做的計算與我的計算相同。

如果谷歌僅將該提示主要顯示給民主黨人，或者顯示給左傾或偏左的人，那將產生更大的影響。在極端情況下，民主黨獲得的選票將比共和黨獲得的選票多出460萬，這是另一種效應，我們稱其為「差異人口統計效應」（differential demographics effect，DDE）。正如我之前所說，我偶然發現這些現象，並且一直在努力嘗試理解它們，並對其進行量化。

大多數這些影響類型在人類歷史上從未發生過。網際網路造就了科技巨頭，也可能被這些科技巨頭完全掌握與壟斷。換句話說，你無法抵消這種影響，即使找到原因，也無法完全消滅它。

楊傑凱：因此，您成功建立了龐大的監視系統。有至少1千人、甚至更多人在研究搜尋引擎的操縱效應，那有無法發現DDE或其他效應的情況嗎？

愛潑斯坦：當然。到目前為止，我已經確定大約有12種效應，例如SEME、DDE和TME。但肯定還有其他方法，畢竟這只有我在研究。到目前為止，一直努力去發現這些效應並對其進行量化和研究的只有我一人，我也是唯一設置監視系統來捕獲短暫經歷的人。這令我覺得很奇怪，我想這需要有所改變。到2020年將非常棘手，如果只有我和我的同事蒐集所有這些數據，會能產生影響或改變什麼嗎？

楊傑凱：您的意思是，需要更多人來參與這個領域的研究，是嗎？

愛潑斯坦：確實應該有很多像我這樣的人，分散在不同的機構展開這樣的工作。政府、非營利組織、大學裡都應該有人在從事類似這種研究。我希望在2020年，如果有更突破且可信的發現，再將這些數據移交給合適的主管部門和專家，應能為社會帶來一些真正的改變。

楊傑凱：這真是了不起的工作，非常感謝您！

愛潑斯坦：謝謝。（全文完）◇