- 庫存 = 5
- 放入購物車
- 放入下次購買清單
打開演算法黑箱:反噬的AI、走鐘的運算,當演算法出了錯,人類還能控制它嗎?
- 作者:漢娜.弗萊(Hannah Fry)
- 出版社:臉譜
- 出版日期:2019-05-02
- 定價:399元
- 優惠價:79折 315元
- 優惠截止日:2024年12月25日止
-
書虫VIP價:315元,贈紅利15點
活動贈點另計
可免費兌換好書 - 書虫VIP紅利價:299元
- (更多VIP好康)
本書適用活動
分類排行
內容簡介
演算法為我們的道德下定義、秤量我們的情緒表現、掏空我們的民主體制
——迎接演算法美麗新世界,我們如何在機器時代當個人?——
★Amazon年度百大好書!英國皇家學會科學圖書獎決選作品!
★出版前即高價售出多國版權,最受矚目的演算法書籍之一!
★訪談演算法的創造者和演算結果的接受者,收錄大量故事和實例研究!
▍ 各界讚譽推薦
丁彥允 ∣ 喜門史塔雷克創辦人兼總經理
王國禎 ∣ 國立交通大學資訊工程學系教授
王傑智 ∣ 國立交通大學電機工程學系教授、工業技術研究院機械與機電系統研究所數位長
李友專 ∣ 臺北醫學大學醫學科技學院特聘教授兼院長
林守德 ∣ 國立臺灣大學資訊工程學系教授、教育部人工智慧技術及應用人才培育計畫辦公室主任
林福來 ∣ 臺灣師範大學名譽教授
洪文玲 ∣ 台灣科技與社會研究學會理事長
許素朱 ∣ 國立清華大學藝術學院院長暨科技藝術研究中心主任
張智皓 ∣ 《今天學哲學了沒》作者
郭榮彥 ∣ Lawsnote創辦人、律師
陳適安 ∣ 台北榮總醫院副院長
趙坤茂 ∣ 國立臺灣大學資訊工程學系教授
劉士達 ∣ 國立清華大學科技藝術研究中心科技創新組組長、藝術學院科技藝術跨域學士班講師
鄭國威 ∣ 泛科知識公司知識長
盧鴻興 ∣ 國立交通大學統計學研究所教授
▍ 該讀哪本書、該走哪條路,演算法說了算!但演算法真的比它將統治的人類更優秀?
■ 當人工智慧遇上天然呆,什麼時候該相信機器、什麼時候該信任自己的判斷?
■ 有些熱門商品擺明就是廢、有些保證火紅,演算法能不能發掘出當紅炸子雞?
■ 演算法對犯罪率的預測大幅超越人類法官,可以用演算法來保障社會正義嗎?
■ 人類的感覺是否能夠用演算法來量化,我們能否接受自己的情緒受到操縱?
■ 演算法代表我們做出改變人生的抉擇,AI時代的權力究竟掌握在誰手上?
▍ 演算法就在我們的醫院、我們的法庭、我們的車輛裡
你被控涉嫌犯罪。比較希望誰來決定你的命運——人類,或是演算法?
演算法比較前後一致,比較不容易判斷失誤。但能在宣判之前聽你說真心話的,是人類。
你需要移植肝臟才能活命。希望誰來決定器官分配?
演算法可以幫器官捐贈者找到合適的病患,可能挽救更多的生命。但它說不定會把你排到名單的後頭去。
你正想買一輛無人駕駛車。有一輛車的程式設計是在車禍時盡可能多救幾條命,另一輛則保證把自己車上乘客的性命列為優先。你選哪一輛?
歡迎來到演算法的時代,這個故事是關於一個不太遙遠的未來,機器統治至高無上,進行各種重大決策——不管是醫療保健、運輸、金融、安全、我們看什麼、我們去哪裡,甚至是要把誰送去坐牢。那麼,我們應該依賴機器到何種程度?我們想要什麼樣的未來?
著名數學家漢娜.弗萊帶領我們踏上的這趟旅程,是關於我們周遭無所不在的演算法,其善、其惡、其徹頭徹尾的醜陋。在本書中,她掀開演算法內在的運作、展示其力量、揭露其極限,並檢視演算法是否真的較其正要取代的人類更為進步。
▍對本書的讚譽
本書是市面上科學寫作的珍寶。漢娜.弗萊以具說服力的敘述和魅力風格,概括電腦演算法的數學要點,並闡明這些數學如何改變諸如醫療保健、司法、運輸和藝術等領域。在我們這個日益為數據所驅動的世界,她是睿智的導覽員,帶我們看見這個世界的優勢與可怖。
——艾利克斯.貝洛斯(Alex Bellos),《數字奇航》(Alex’s Adventures in Numberland)作者
本書是針對我們周遭無所不在的演算法,一部輕快活潑又親近易讀的指南。
——喬丹.艾倫伯格(Jordan Ellenberg),威斯康辛大學麥迪遜分校數學教授、《數學教你不犯錯》(How Not to Be Wrong)作者
以前,電腦是工具,接著是玩具;現在,它在我們周遭隨處可見。在這個令人不知所措的新世界,找不到比漢娜.弗萊更棒的導覽員,她的這部著作隨處可見機智、敘事精采且極其透徹的洞見。太棒了!
——提姆.哈福特(Tim Harford),《親愛的臥底經濟學家》(The Undercover Economist)和《轉角遇見經濟學》(Fifty Things that Made the Modern Economy)作者、電視及廣播節目主持人
本書是緊張刺激、節奏明快的閱讀經驗,你將被激怒、受到挑釁和挑戰。眾多經過縝密研究的例證,揭露我們生存其中的驚人新世界,而目的曖昧不明的黑箱決策,正在決定我們個人與集體的命運。歡迎來到大數據的現代世界,你滿有可能被惡搞了。
——凱西.歐尼爾(Cathy O’Neil),《大數據的傲慢與偏見》(Weapons of Math Destruction)作者
每一個不假思索地將我們的命運交託給演算法的人,都應該閱讀漢娜.弗萊精湛又令人愉悅的召喚之作。因為你知道嗎,機器決定的未來可能恰違背我們人類的最佳利益。
——大衛.羅文(David Rowan),英國版《連線》雜誌(Wired)創始主編
敘事熟稔精妙、睿智且筆調輕鬆,漢娜.弗萊對於我們如何在人工智慧時代生存的精采探討,將在未來若干年的吧檯邊、餐桌旁激盪出更多論辯。
——亞當.拉塞福(Adam Rutherford),英國演化生物學家、科普作家
漢娜.弗萊是這個星球上最棒的解說者之一。在本書中,她著手處理一項需要認真思考的議題,以其明晰的筆法、迷人的故事,以及一貫的幽默感和令人愉悅的風格,娓娓道來。
——史蒂芬.斯托蓋茨(Steven Strogatz),康乃爾大學數學教授、《X的奇幻旅程》(The Joy of x)作者
弗萊以令人耳目一新的簡明文筆,說明人工智慧、機器學習和複雜的演算法的真正涵義,對劍橋分析醜聞、無人駕駛車和其他許多讓人不安的現代現象提供一些簡潔的解釋。
——凱蒂.蓋絲特(Katy Guest),《衛報》(The Guardian)
對不熟悉人工智慧技術面向的讀者來說,本書提供了演算法如何運作的最佳通俗解說。
——《科學》期刊(Science)
風格獨具、深思熟慮又一絲不苟的持平記述,說明日漸支配我們生活的軟體能做到和無法做到的事……一部出色易讀的導覽,從一個故事輕鬆轉換到另一個故事,不讓讀者覺得棘手。
——奧利佛.穆迪(Oliver Moody),《泰晤士報》(The Times)
目錄
關於書名的一個註解
導論
【第一章 權力】
回歸基本面/盲目信任/人工智慧遇上天然呆/何時否決/權力鬥爭
【第二章 資料】
聚沙成塔/目標市場/西部蠻荒/劍橋分析/精細操弄/給我評比
【第三章 司法】
一致性的難題/正義方程式/問問觀眾/人類vs機器/尋找黑武士/機器的偏差/艱難的決定/總結
【第四章 醫療】
模式獵手/視物機器/AI盟友/修女研究/預測的力量/數位診斷/親愛的,這是最基本的/麻煩的資料/隱私問題/基因洩天機/最大的善?
【第五章 車輛】
我周遭有什麼?/貝牧師的大教堂/所以,你的無人駕駛車應該去撞行人來救你的命嗎?/違反道路規則/公司寶寶/自動化的反諷/寄予厚望
【第六章 犯罪】
山貓行動與草坪灑水器/未來圖表/標示與助長/犯罪預報機/預言付諸實現/你以為你是誰?/看見分身/百萬分之一?/取得平衡/複雜難解的取捨
【第七章 藝術】
多重世界/獵尋當紅炸子雞/品質量化/「傑出的藝術家模仿,偉大的藝術家盜竊」——畢卡索
【結語】
人類加上機器
謝辭
注釋
內文試閱
◎多重世界
在所有形式的娛樂活動中,我們都把熱門度當成品質的代表物在用。舉例來說,二○○七年有一項研究,審視了《紐約時報》暢銷書排行榜對於一本書的公眾知名度有何影響。該項研究作者艾倫.索倫森(Alan Sorensen)藉由探討排行榜編製方式的特異慣例,尋找那些原本應該依其實際銷售上榜,卻因時間延誤及意外疏忽而未上榜的書籍銷售成功的軌跡,並與那些真正上榜的書籍進行比較。他發現一個戲劇化的效應:光是上榜就讓銷售平均增加百分之十三至百分之十四,第一次出書的作家則增加百分之五十七的銷售。
我們運用越多平台來看有哪些東西熱門——暢銷書排行榜、亞馬遜排名、爛番茄評分、Spotify排行榜——社會認同所造成的影響就會越大。當拋給我們的選項數以百萬計,加上行銷手段、知名度、媒體炒作和評論讚賞全都在爭取你的注目,效應更進一步放大。
這一切都意味著,有時可怕的音樂也能登頂。這不是只有我在憤世嫉俗。一九九○年代,英國有兩位充分了解此一事實的音樂製作人,謠傳他們打賭誰能把爛到不可能再爛的歌曲弄上排行榜。據說,這場賭局的結果是一個叫做Vanilla的女子樂團,她們初登場的歌〈No way no way, mah na mah na〉,是以著名的布偶電視節目歌曲改編而成。這個樂團的演出成果只能寬容地描述為是在唱歌沒錯,一件看起來像是用微軟小畫家做出來的藝術作品,一段大有助於拿下歷來最糟表演獎的行銷影片。但Vanilla有強大的盟友。由於幾家雜誌的專題報導,以及上BBC的電視節目《流行金榜》(Top of the Pops)亮相,這首歌還是成功登上排行榜第十四名(原注:可惜本書格式不適於節錄音樂,因為我真的希望讓你們聽聽這首歌爛到多好笑。你們會去Google一下吧?)。
老實說,這個樂團的成功很短命。到了她們的第二支單曲,熱門程度已經開始衰退。她們從未發表第三支單曲。這一切的確像是在暗示,社會認同並非唯一有作用的因素——真的就像「音樂實驗室」(Music Lab)團隊的後續實驗所證明的。
他們第二項研究的設計大致和第一次相同。但這次為了測試從熱門度的感受變成自證預言(self-fulfilling prophecy,譯注:指人們先入為主的判斷將或多或少影響人們的行為,亦即我們會在不經意間使自己的預言成為現實)到何種程度,研究人員增加了一項轉折。每個世界的排行榜一有機會穩定下來,他們就暫停實驗,把排行榜上下翻轉過來。樂手網頁的新來訪客看到排行榜榜首列在底下,而墊底的輸家一副登頂菁英的樣子。
訪客的下載總次數幾乎是立刻往下掉。一旦排頭的音樂缺乏吸引力,人們對整個網站的音樂都興趣缺缺。此時居排行榜頂端的冷門歌曲下載衰退最為顯著。另一方面,在底下發愁的好歌表現比在榜頂時要差,但還是比先前落居榜尾的那些歌要好。如果科學家讓實驗進行得夠久,最佳歌曲會恢復熱門度。結論是:市場不受特定狀態所限。運氣和品質都發揮了作用。
回到現實——只有一個世界的資料量可做為依據——對於音樂實驗室的實驗發現,有一個直截了當的解讀。品質重要,而且與熱門度並不相同。最佳歌曲恢復熱門度,證明有些音樂先天就是「比較好」。在光譜這端,魅力迷人的藝術家所表演的動人歌曲,應當是(至少在理論上是)注定要成功。但其中的蹊蹺是:反之不必然成立。不是只因為某樣物事成功,就代表它有高品質。
你到底怎麼定義品質,那完全是另一回事,我們待會兒再來談。但對某些人來說,品質本身不一定重要。如果你是唱片公司、電影製片或出版社,棘手的問題在於:你能不能事先找出保證會成功的東西?演算法能不能發掘出當紅炸子雞?
◎獵尋當紅炸子雞
投資電影是一門有風險的生意。賺錢的電影很少,大多數勉強打平,慘賠是這個圈子的常態。這是一門輸贏很大的生意:當製作一部電影的成本衝上以千萬、以億計,產品需求預測失敗的代價,會是災難等級的高昂。
這是迪士尼從二○一二年上映的電影《異星戰場:強卡特戰記》(John Carter)艱苦學到的教訓。製片廠投入三點五億美元製作這部電影,認定這部片應該和《玩具總動員》、《海底總動員》之類並駕齊驅,成為他們下一部搖錢大作。沒看過嗎?我也沒有。這部電影沒能抓住大眾的想像力,一口氣賠了兩億美元,導致迪士尼製片廠負責人請辭。
好萊塢要人一直都能接受一件事:就是沒辦法準確預測電影能否賣座成功。這是本能主宰一切的國度。在那些票房可能慘賠的電影上賭一把,正是這項工作的一環。一九七八年,美國電影協會主席兼執行長傑克.瓦倫蒂(Jack Valenti)說道:「沒有人能告訴你一部電影在市場上會怎麼樣。沒有人能,直到這部影片在關燈後的戲院裡開演、光點在銀幕與觀眾之間飛騰。」五年後的一九八三年,《公主新娘》和《虎豹小霸王》幕後劇作家威廉.高德曼(William Goldman)說得更簡潔:「不管是啥都沒人知道。」
然而,正如我們在本書通篇所見,現代演算法能如例行公事般預測乍看不可預測之事。為什麼電影就該與眾不同?你可以測量電影的成功,以收入、以影評接受度。你可以測量與電影結構和情節有關的各種因素:主演卡司、類型、預算、片長、情節安排等等。所以,何不應用同樣這些科技,試著找到寶物?揭露哪些影片注定票房大賣?
這已經成了近年來眾多科學研究的野心所向,企圖深入網路電影資料庫(IMDb)或爛番茄這類網站所蒐集、挑選的龐大豐富資訊。而且——或許並不讓人意外——有許多令人感興趣的洞見隱藏在這些資料裡。
以二○一三年由薩密特.斯里尼瓦森(Sameet Sreenivasan)所進行的研究來說吧。他了解到,藉由要求用戶給影片標記情節關鍵字,IMDb創造出驚人詳細的描述詞目錄,可以顯示出我們的電影品味隨時間有何種演進。在他進行研究期間,IMDb的目錄裡已有超過兩百萬部影片,橫跨超過一個世紀,每一部都有多重情節標記。有些關鍵字是對電影的高階描述,像是「組織犯罪」或「父子關係」;有些則與地點相關,像是「紐約市曼哈頓」,或是關於具體的情節重點,像是「用槍指著」或「綁在椅子上」。
這些關鍵字本身顯示,我們對某些情節元素的興趣往往會突然激增;想想二戰影片或處理墮胎主題的電影。突然間,類似主題很快就會接連有大量作品發表,然後平靜一陣子。把這些標記放在一起考量,讓斯里尼瓦森能夠給每一部電影上映當時的新鮮感打分數——一個介於0到1之間的數字——可以和票房成績做個對比。
如果特定的情節重點或關鍵——像是女性裸露或組織犯罪——在之前的電影中經常見到,關鍵字會讓這部電影在新鮮感方面拿到低分。但任何原創的情節特色——比方說,像是一九七○年代動作片引進的東方武術——會在這項特色第一次出現於銀幕時拿到新鮮感高分。
結果證明,我們和新鮮感之間有一種複雜的關係。平均來說,一部電影的新鮮感得分越高,票房的表現就越好。但只能好到某個程度。越過那道新鮮感門檻,有一道懸崖在等著;任何得分超過零點八的影片,賺到的票房收入會如落崖直墜般急遽大減。斯里尼瓦森的研究證明了社會科學家長久以來所懷疑的:平庸令我們不喜,但完全陌生也讓我們生厭。最佳影片就落在「新」和「不太新」之間窄窄的最佳平衡區內。
新鮮感分數或許是一個有用的方法,可協助製片廠避免幫大爛片背書,但如果你想知道個別影片命運如何,幫助就不大了。對此,歐洲有一組研究人員的工作成果可能比較有用。他們發現,在電影上映前那一個月,該影片在維基百科條目頁面上的編輯次數,和最後的票房斬獲有某種關聯性。條目編輯往往是與電影上映沒有關係的人所為——純粹是典型的電影迷給該頁面增加資訊而已。編輯次數越多,意味著伴隨電影上映而來的興奮情緒越高昂,進而使得票房收入越好。
整體而言,他們的研究模型略有預測能力:研究的三百一十二部影片中,他們以百分之七十以上的準確率,正確預測其中七十部影片的票房收入。但一部影片表現越好,以及維基百科頁面上所做的編輯次數越多,可供研究小組做為依據的資料就越多,而他們所做的預測越精準。對於六部高獲利影片票房斬獲的正確預測,達到百分之九十九的準確率。
這些研究有知性上的趣味,但一個模型只在影片上映前一個月有效,對於投資者沒有太大用處。何不轉而正面處理問題,採計在此過程初期已經知道的所有因素——類型、領銜演員的名氣、年齡分級(輔導級、十二歲以上等等)——並運用機器學習演算法,來預測一部影片是否會熱賣?
有一項從二○○五年開始的研究就是這麼做,運用類神經網路,嘗試在戲院上映之前很久便預測影片的表現。為了讓事情盡可能簡化,研究論文的作者排除對精確預測收入的嘗試,改為試著將電影分為九種類別,從全面慘賠到破表熱賣。不幸的是,即使有了這道簡化問題的步驟,成果仍有很大的改進空間。類神經網路的表現優於以前嘗試過的任何統計技巧,但對電影表現的分類仍然只做到平均百分之三十六點九的正確性。收入超過兩億美元的頂級類別好一點,以百分之四十七點三的正確率,辨識出那些真正破表熱賣的影片。但投資者很謹慎。演算法挑選為注定熱賣的影片,大約有百分之十最後賺不到兩千萬美元——照好萊塢的標準,這是個令人一掬同情淚的數字。
之後其他研究嘗試過要改進這些預測,但還沒有一個做出效果顯著的躍進。所有證據都指向同一個方向;除非你有早期觀眾反應的資料,熱門度大致上是不可預測的。說到要從成堆影片中挑出賣座片,高德曼說得對:不管是啥都沒人知道。
◎品質量化
所以說,熱門度的預測很複雜。要從我們大家都喜歡,拆解出我們為什麼喜歡,並非易事。這給創意領域的演算法提出了一個滿大的問題。因為如果你無法運用熱門度來告訴自己什麼是「好的」,那麼你又如何能對品質進行測量呢?
這一點很重要:如果我們希望演算法具有任何一種內在於藝術之中的自主性——無論是創作新作品,或是對我們自己創作的藝術提出有意義的洞見——我們都會需要對品質做某種測量來做為依據。必須有一種客觀方法為演算法指出正確的方向,一種可以回溯的「正確答案」,就像是「這簇細胞是癌性」或「被告繼續犯罪」在藝術上的類比。沒有這東西,要進步便困難重重。如果我們沒辦法定義我們所謂的「好」,就沒辦法設計出譜寫或尋找「好」歌的演算法。
不幸的是,試圖找出品質的客觀衡量標準時,我們遇上一個遠溯至柏拉圖且深具爭議性的哲學問題。一個已經爭論超過兩千年的主題:你如何判斷藝術的美學價值?
有些哲學家如萊布尼茲主張,如果有可以讓我們全都一致同意為美的對象,比方說米開朗基羅的大衛雕像或莫札特的《落淚之日》,那就應該有某種可定義、可衡量的美之本質,使得某一件藝術品在客觀上較另一件為佳。
但另一方面,所有人都一致同意是相當罕見的。有些哲學家如休姆則主張,美在於觀者之眼(俗稱「情人眼裡出西施」)。舉例來說,想想安迪.沃荷,他的作品帶給某些人強而有力的美感體驗,其他人則覺得,就藝術而言,與一個湯罐頭不分軒輊。
還有些哲學家——康德也名列其中——曾說過,真理介於這兩者之間。我們對美的判斷不全屬主觀,也不可能全然客觀。這些判斷同時是感官的、情緒的且知性的——而且最重要的是,可以視觀者心態而隨時間改變。
此一觀念當然有證據支持。班克西(Banksy)的粉絲或許還記得二○一三年他是怎麼在紐約中央公園設攤位,匿名販售原創黑白噴畫,每件六十美元。攤位夾在其他販售常見觀光紀念品的成排攤位中間,所以這個標價牌一定讓那些路過的人覺得很貴。過了幾個小時,才有人決定要買。這天的收入總計四百二十美元。一年之後,在倫敦一場拍賣會上,另一位買家認為,這同一件藝術作品的美學價值高到足以誘使他們花上六萬八千英鎊(當時約十一萬五千美元左右),就買一幅畫。
不可否認,並非每個人都喜歡班克西(英國科幻驚悚單元劇《黑鏡》﹝Black Mirror﹞創作者查理.布魯克﹝Charlie Brooker﹞曾說他是「一個呆頭,﹝他的﹞作品在白痴看來是聰明到讓人眼花啦」)。所以,你或許會主張這個故事只證明班克西的作品並無內在的品質,只是靠著通俗炒作(及社會認同),才催出那些高到讓人噴淚的價格。但在無可否認的高品質藝術形式方面,也已經看出我們美學判斷的反覆無常。
我最喜歡的例子是《華盛頓郵報》在二○○七年所進行的一項實驗。該報向國際知名小提琴家約夏.貝爾(Joshua Bell)提出請求,在他門票售罄的各音樂廳表演行程之外加開一場音樂會。貝爾帶上他的三百五十萬美元史特拉底瓦里小提琴,在早上的尖峰時間來到華盛頓特區一處地鐵站的電扶梯頂,放了一頂帽子在地上收賞錢,表演了四十三分鐘。正如《華盛頓郵報》所言,這是「全世界最頂尖的古典音樂家之一,以歷來所製作最有價值的其中一把小提琴,演奏幾首歷來所譜寫最優雅的音樂」。結果呢?有七個人停下來聽了一會兒,超過一千多人直接走了過去。到他表演結束時,貝爾的帽子裡收到少得可憐的三十二美元十七美分。
我們所認為的「好」,也在改變。某些古典樂類型的品味對時代的變遷適應得異常良好,但同樣的說法無法套用在其他藝術形式上。倫敦帝國學院演化生物學教授阿曼德.萊洛(Armand Leroi)研究過流行樂的演化,從分析中找到我們品味改變的清楚證據。「人們對於枯燥乏味有一個先天的門檻。當人們需要新事物時,就會有一種緊張關係逐漸形成。」
以一九八○年代後期風靡流行樂界的鼓機和合成器為例——風靡到排行榜上的音樂多樣性急遽減少。「每一首聽起來都像早期的瑪丹娜,或是杜蘭杜蘭的某些作品,」萊洛說明道:「所以,或許你會說:『很好,我們已經達到流行樂的顛峰了。這就是顛峰所在,終極的格式已經找到了。』」只不過,當然囉,這個格式還沒找到。不久之後,隨著嘻哈音樂的到來,排行榜的音樂多樣性再次爆發。引發轉變的嘻哈有什麼特殊之處嗎?我問萊洛。「我不這麼認為。也有可能是別的什麼,只不過正好是嘻哈。美國消費者對此有所回應並說道:『哦,這可是新花樣,再多給我們一些吧。』」
重點在於:即使有某種客觀判準使得某件藝術作品優於另一件,只要脈絡淵源在我們對藝術的美學欣賞中仍扮演某種角色,就不可能創造出用之於所有時代、所有地域皆成立的美學品質確實標準。無論你施展了何種統計學技巧,或是人工智慧手法,或是機器學習演算法,試圖用數字來掌握卓越藝術的本質,那就像是用你的手去抓煙霧一般。
但演算法需要「某種東西」才能進行。所以,一旦你剔除了熱門度和內在品質,剩下來唯一能夠量化的東西是:與以往曾出現事物之相似性的度量標準。
利用對相似性的衡量,還是有很多可為之處。說到推薦引擎,像是Netflix和Spotify建立的那些,相似性理當是理想的衡量標準。兩家公司都有辦法協助用戶找出新的影片或歌曲,而且做為訂閱服務供應商,兩家都有準確預測用戶喜好的誘因。他們不能以現在流行什麼做為他們演算法的依據,否則用戶會遭到小賈斯汀和《電影版粉紅豬小妹》(Peppa Pig The Movie)的推薦訊息疲勞轟炸。他們也不能以品質的任何一種代表物為依據,像是評論文章之類,因為如果他們這麼做,首頁會被學院派無聊到令人打瞌睡的討論給淹沒。這種時候所有人想做的,其實是在上了漫長的一天班之後,踢掉他們的鞋子,用一部驚悚爛片麻痺自己,或是盯著加拿大演員雷恩.葛斯林(Ryan Gosling)看上兩個小時。
相較之下,相似性讓演算法得以直截了當將焦點對準個人的喜好。他們都聽些什麼、他們都看些什麼、他們一次又一次回來找什麼?從這裡出發,你可以利用IMDb、維基百科、音樂部落格或雜誌文章,抽出與每一首歌、每一個藝術家或每一部電影有關的一系列關鍵字。這樣做出整套的編目,接下來的步驟很簡單,就是尋找並推薦其他有相似標記的歌曲和影片。除此之外,接著你還可以找出其他喜歡類似電影和歌曲的用戶,看看他們還喜歡哪些歌曲和影片,然後推薦給你的用戶。
Spotify或Netflix從來沒打算提供完美的歌曲或影片,他們對完美沒什麼興趣。Spotify Discover並未承諾找出地球上那唯一一組、注定與你的品味和心情完全無瑕契合的樂團。推薦演算法只提供好到保證不會令你失望的歌曲和影片,提供你一種無害的方式來消磨時間。偶爾會提出你絕對喜歡的東西,但這有點像是那種意義下的冷讀法(cold reading,譯注:占卜師或靈媒未事先蒐集相關資訊,而是現場從解讀對象的肢體動作、衣著、髮型或交談內容等線索做出猜測)。你只需要偶爾來一顆好球,感受一下發現新音樂的幸運,這些引擎並不需要永遠都對。
相似性在推薦引擎上的運作非常完美。但當你要求演算法創作藝術,卻沒有提供純屬品質的衡量標準,事情開始變得有趣起來。如果演算法對於藝術唯一的理解就是以往有過什麼,那麼它還能有創意嗎?
延伸內容
【推薦序】
這真是一本好書,解開「演算法」這個時髦科技魔法箱子!!
《打開演算法黑箱》這個書名就非常吸引人,彷彿告訴你可以解答許多黑色魔法的祕密,其實「演算法」這個名詞已經在學術界、產業界長久以來應用於蒐集到的資料來進行分析及相關預測,最常見於醫療診斷、司法體系、新興的商業購物及帶有大量政治爭議性的民主選舉操作。為何這幾年來任何一種方案只要加上「機器學習」、「人工智慧」、「類神經網路系統」等字樣,似乎這個方案就有了魔法般,馬上成為行業中權威的代名詞?人類似乎知曉自身的缺陷(決策帶有情感、無法長期處理單一重複動作),而將完美的解決方案投射於一台能夠自我學習成長又永遠不帶情緒、喜好偏見的自動化電腦!然而大家卻不知道每一種演算法的SOP 及邏輯推理都是設計者(人類專家)預先設定的啊!當然機器學習後的演算法一定是可以幫助人類解決大部分消耗腦力判斷的工作,也一定能大幅提升生活的品質甚至到更高的境界,然而如果演算邏輯的設定來自於人類,那麼意味著每一台機器的決策思考點是否又面臨著道德的風險與矛盾呢?因為每個演算邏輯設計者就還是生命中伴隨著喜怒哀樂成長歷程的你跟我啊!
對於想要了解「演算法」是什麼、演算法為何能夠成為科技新魔法的你,絕對是你不能錯過的一本好書。
—— 丁彥允(喜門史塔雷克創辦人兼總經理)
在《打開演算法黑箱》這本著作中,作者漢娜.弗萊搭配生動的真實案例,告訴我們資料和機器學習型演算法如何改變現代生活的每一個層面,從司法體系、醫療保健、無人駕駛車,到犯罪預測及防範、藝術創作等,以及人類該如何因應。作者藉著多個依賴演算法做決定而造成傷害的故事,說明不要盡信人工智慧機器的權威。她建議演算法和人類以夥伴關係一起合作,善用彼此的強項,並且互相提升彼此的能力。此外,作者提到免費的演算法正刺探我們的隱私,蒐集及運用個人資料以獲利,也因此歐盟已立法制定了「一般資料保護規則」。她也提及一些瀏覽器已有內建的「智慧防追蹤」。我們應該敦促政府檢討及修正「個人資料保護法」,更完善保障個人隱私及消費者權益。總括而言,這本著作提醒我們在享受人工智慧機器帶來更便利的生活之餘,也要思考人類在這智慧時代的定位。
—— 王國禎(國立交通大學資訊工程學系教授)
如作者所言:未來,不是偶然,而是你我使然。人工智慧因人而生,這次將徹底改寫人類的未來。
—— 李友專(臺北醫學大學醫學科技學院特聘教授兼院長)
《打開演算法黑箱》這本書不斷交錯著兩種正反互駁的觀點:演算法可以很厲害,也可能犯很愚笨的錯誤;信任它可能可以走得很遠,但盲目的信任往往會導致巨大的災害;它往往複雜得難以解釋,但卻不是不可能被操弄;它可以帶給人類更美好的生活,但是也同時帶來隱私與安全上的隱憂。在人工智慧的世代,人類如何能善用之並與其和平共處,相信讀者從這本書中可以找到許多的啟發。
—— 林守德(國立臺灣大學資訊工程學系教授、教育部人工智慧技術及應用人才培育計畫辦公室主任)
生活科技培養設計思考。
資訊科技培養演算思維。
這是最新十二年國教中學資訊教育的兩門課程。《打開演算法黑箱》這本書啟迪我們學習如何思考設計演算法,適合做為科技教育的必讀選材。
演算法是讓電腦按照步驟執行大量演算的指令清單。演算法清一色是數學運算:運用方程式、算術、代數、微積分、邏輯和機率等,並轉譯成電腦編碼。這是為什麼在AI的時代,先進國家一再強調未來數學基礎好的人才是社會最需要的。
演算法已滲透到我們的各種日常。本書從權力的觀點,控制與被控制的角度做為上位綱領,以實例深入剖析司法判刑、醫療診斷、自駕車的倫理、犯罪預期、藝術仿真等既已發生的議題,跨越科技領域,從心理學、社會學、法學、醫學、音樂、美術、文學等等,穿透力十足的整理、論辯,引領我們思考,人類與機器的強項必須如何協調整合才能讓「演算法的整體淨效益成為社會健康發展的正能量」。這本書是大學通識教育的優良教材。
作者數學家漢娜.弗萊她嚴謹論證的特質,在本書的撰寫上充分的延伸發揮了。
這是一本超越休閒性的科普讀物,生活在數位AI時代,必讀!
—— 林福來(臺灣師範大學名譽教授)
本書說的機器,已經不再是工業時代靠著機構與內燃機哐啷作響的生產設備,而是在看得見的你我手上的手機、車上的微電腦主機板,或是也許在遠的、看不見的機房裡,用許多方式組成或大或小的資訊設備。它們不太做實際的「動作」,但實際上以某種「難以名之」的方式,影響了在這個社會裡能動作的人——我們。這種難以看見接觸,高度專業性,同時也被鑲嵌在龐大技術系統裡的資訊運作,對於廣大的一般人來說,是難以想像的黑箱。黑箱雖並不直接等於惡或是無法挑戰的霸權,我們首先必須能意識到黑箱的存在,並且對黑箱中運作的技術有興趣,時時不斷地保持敏銳與好奇,對於生活在資訊時代的這個人生,堅持一些重要做為人的價值。
資訊科學的興起是奠基在數學上。博士時期以數學角度研究流體學領域微小液滴變形的漢娜.弗萊,之後以討論各種生活中常見的事物,推廣公眾對數學的興趣,在二○一八年獲得Christopher Zeeman Medal for Communication of Mathematics的肯定。《打開演算法黑箱》以各種發生過的實例,從說明及分析基礎的數學邏輯——演算法——如何與在事件中的人互動,提點出這個時代做為一個人的挑戰,與任務。
人工智慧(AI)有沒有智慧很難斷定,但確是實實在在地滿載了演算法和繁重(發展演算法和應用演算法)的工人(labour)時數的努力;談演算法的書沒有數學公式,但敘說了過去數學邏輯與社會運作人類生活種種幸與不幸的交織。新世界如何美麗?我們如何拆解黑箱、透明化黑箱,甚至從頭開始建立民主、開放的,根本沒有「箱」的知識系統?
這是一本寫給人的書,寫給黑箱外、也是寫給黑箱裡的人看的書。在台灣學術、教育領域正極力推展AI做為新顯學的今日,出生在這個時代的年輕天然資訊人,曾經經歷過,或參與過,演算法從解一個小的偏微分方程,到協助今日鋪天蓋地的臉部辨識、自駕技術的蓬勃發展與運用的中年世代,還有在農業時代成長、在資訊時代成熟的所有人,這是寫給你的書。
—— 洪文玲(台灣科技與社會研究學會理事長)
科技時代,AI做為一種選項,我們應該考量的不是「用」或者「不用」,而是「怎麼用」。要回答這個問題,我們需要知道AI可以「做什麼」。在這點上,本書無疑是成功的。漢娜.弗萊從具體案例出發,透過平易近人的口吻,向我們展示演算法早已是日常生活中不可或缺的一環,時刻影響著我們的選擇。如果你仍認為人生掌握在自己手中,我會強烈建議你讀讀這本書。
—— 張智皓(《今天學哲學了沒》作者)
人工智慧或演算法對於司法裁判的影響爭論已久,從二○一六年開始,法律人和科技人對於司法的判決,由人類法官決定,或是由演算法來決定何者更優,雙方各執一詞爭論不休。
如果你對於只從片面的角度探討這個問題,拉抬自己認同的驕傲專業感到厭煩,那麼應該來看看這本書。
作者客觀的評價了演算法和司法系統的衝突與矛盾,沒有高估了科技,也沒有低估人與人之間的矛盾對於制度的影響,真實的評價了人類社會一個真實的糾結:「我們不喜歡錯誤,但不可否認的,錯誤是人類社會的一部分」。
—— 郭榮彥(Lawsnote創辦人、律師)
進入人工智慧時代,我們該如何規範人工智慧,或甚至反過來說,人工智慧該如何規範我們,是不容迴避的課題。本書透過大量案例顯示,人們不完全理解我們部署的系統潛在危險。當前的機器學習運行得如此之快,以至於沒有人真正知道機器是如何做出決策,甚至連開發人員也不知道。這些系統還會持續從環境中學習並更新他們的函式,使研究人員更難控制和理解決策過程。在這樣缺乏透明度的黑盒子問題籠罩下,要建立道德準則跟規範,當然就極為困難。但人類的專家有的偏見跟偏誤,更是早就被證實有更大的問題,而我們不也是一直倚賴這樣有缺陷的系統在運作嗎?你跟我若是在運氣不好,在不久後的某一天上法庭,非常有可能是接受機器法官的判決。身為人類,你認為下一步該怎麼做呢?看完這本書,我想你會對於這個難題有個好答案。
—— 鄭國威(泛科知識公司知識長)編輯推薦
【編輯推薦】
2045年,奇點到來,人工智慧超越人類大腦,機器接管科技發展。2062年,人工智慧打造未來,我們所知的世界天翻地覆改變。人類與人工智慧的博弈競合,還有二三十年的你追我跑時間嗎?
現今我們生活的世界早已被無所不在的演算法掌控,有些演算法對我們有益、有些有用,有些則可能使我們陷入大麻煩。當我們有疑問時,在網路上搜尋資料,要靠演算法來找出真相;當我們想預防犯罪,憑藉臉部辨識查找可疑人物,要靠演算法來實踐正義;當我們希望頭好壯壯,藉由機器提供精確診斷,要靠演算法來量身打造治療計畫。
演算法正悄悄掌控我們的身、心、靈。《打開演算法黑箱》一書恰帶領我們思考:生而為人的我們是什麼樣的人?我們希望我們的美麗新世界是什麼樣貌?更多編輯推薦收錄在城邦讀饗報,立即訂閱!GO
作者資料
漢娜.弗萊(Hannah Fry)
倫敦大學學院(University College London)城市數學副教授。每天的工作是運用數學模型來研究人類行為模式,曾與政府部門、警方、醫療保健分析師和超市合作。 在TED上的演講累積數百萬人次觀看,並為BBC和英國公共廣播電視服務網(PBS)製作過多部電視紀錄片;主持BBC長期播出的科學性播客節目《拉塞福與弗萊的好奇事件簿》(The Curious Cases of Rutherford & Fry)。 著有《數學的戀愛應用題》(The Mathematics of Love)等書。
注意事項
- 若有任何購書問題,請參考 FAQ