1. 巧婦難為無米之炊,算力、演算法和數據到底哪個更重要
雖然不能這么絕對的判斷一定誰比誰重要,但在實際應用中很多時候的確是數據更加重要。有幾方面的原因:
在很多問題中,演算法的「好壞」在沒有大量有效數據的支撐下是沒有意義的。換句話說,很多演算法得到的結果的質量完全取決於其和真實數據的擬合程度。如果沒有足夠的數據支撐、檢驗,設計演算法幾乎等於閉門造車。
很多演算法會有一堆可調參數。這些參數的選擇並沒有什麼標准可依,無非是扔給大量數據,看參數的變化會帶來什麼樣的結果的變化。大量、有效的數據成為優化這類演算法的唯一可行方法。
更極端的例子是,演算法本身很簡單,程序的完善全靠數據訓練。比如神經網路。
對於很多成熟的演算法,優化演算法的增量改善通常遠小於增大輸入數據(這是個經濟性的考慮)。
比如問題中舉例的 Google。在它之前的搜索引擎已經把基於網頁內容的索引演算法做得很好了,要想有更大的改善需要換思路。PageRank 演算法的採用大大增加了輸入的數據量,而且鏈接數據本身對於網頁排名相當關鍵(當然他們也做了大量演算法的優化)。
相關介紹:
數據(data)是事實或觀察的結果,是對客觀事物的邏輯歸納,是用於表示客觀事物的未經加工的的原始素材。
數據可以是連續的值,比如聲音、圖像,稱為模擬數據,也可以是離散的,如符號、文字,稱為數字數據。在計算機系統中,數據以二進制信息單元0、1的形式表示。
2. 人工智慧需要什麼基礎
1、核心三要素——算力、演算法、數據(三大基石):
演算法、算力、數據作為人工智慧(AI)核心三要素,相互影響,相互支撐,在不同行業中形成了不一樣的產業形態。隨著演算法的創新、算力的增強、數據資源的累積,傳統基礎設施將藉此東風實現智能化升級,並有望推動經濟發展全要素的智能化革新。讓人類社會從信息化進入智能化。
(1)算力:
在AI技術當中,算力是演算法和數據的基礎設施,支撐著演算法和數據,進而影響著AI的發展,算力的大小代表著對數據處理能力的強弱。
(2)演算法:
演算法是AI的背後「推手」。
AI演算法是數據驅動型演算法,是AI的推動力量。
(3)數據:
在AI技術當中,數據相當於AI演算法的「飼料」。
機器學習中的監督學習和半監督學習都要用標注好的數據進行訓練,由此催生了大量數據標注公司,它們將處於未經處理的初級數據,轉換為機器可識別信息。只有經過大量的訓練,覆蓋盡可能多的各種場景才能得到一個良好的模型。
2、技術基礎:
(1)文藝復興後的人工神經網路。
人工神經網路是一種仿造神經元運作的函數演算,能接受外界資訊輸入的刺激,且根據不同刺激影響的權重轉換成輸出的反應,或用以改變內部函數的權重結構,以適應不同環境的數學模型。
(2)靠巨量數據運作的機器學習。
科學家發現,要讓機器有智慧,並不一定要真正賦予它思辯能力,可以大量閱讀、儲存資料並具有分辨的能力,就足以幫助人類工作。
(3)人工智慧的重要應用:自然語言處理。
自然語言處理的研究,是要讓機器「理解」人類的語言,是人工智慧領域里的其中一項重要分支。
自然語言處理可先簡單理解分為進、出計算機等兩種:
其一是從人類到電腦──讓電腦把人類的語言轉換成程式可以處理的型式;
其二是從電腦回饋到人──把電腦所演算的成果轉換成人類可以理解的語言表達出來。
3. 巧婦難為無米之炊,算力、演算法和數據到底哪個更重要
「巧婦難為無米之炊」,這句話隱含的信息量並不小,正好可以用於對比人工智慧。巧婦的「巧」就是演算法,食材就是數據,而鍋碗瓢盆和爐灶就是算力。
如果沒有食材,就算你有爐灶和鍋碗瓢盆,也沒辦法做出飯,而有了食材,沒有爐灶和鍋碗瓢盆也做不出飯菜,有了食材,有了鍋碗瓢盆,沒有巧婦,也同樣做不出一桌豐盛的飯菜。
數字化歸根結底:
是靠數據驅動的,如果沒有高質量的大數據,那就是巧婦難為無米之炊。因此,做好大數據工作是推進數字化變革的前提性、基礎性工作。但非數字原生企業相比數字原生企業,大數據工作的復雜性和困難度要大的多。
何老師表示,做好大數據工作,要有知難而上的堅強決心。此外,他基於對華為等企業實踐的認真了解研究,結合自身對企業戰略執行的長期深刻體悟,還在演講中給出了切實的決策思路和行動建議。
據悉,《數字企業》之所以能成為數字化轉型、數字化變革的代表性演講,很大程度上是因為既具備企業家的高度、又具備思想家的深度、還具備實踐家的力度。
4. 工業智能的技術整體遵循什麼和演算法三要素的邏輯
工業智能的技術整體上遵循人工智慧的數據、算力和演算法三要素的邏輯。包含智能算力、工業數據、智能演算法和智能應用四大模塊,以工業大神猜數據系統的工業數轎鋒據為基礎,依託硬體基礎能力和訓練、推理運行框架,完成工業數據建模和分析。
模型的建立
好利科技:控股子公司合肥曲速從事GPU晶元、ADAS視覺晶元的研發和銷售,GPU晶元仍處於研發當中。
5. 在智能時代,數據,算力演算法,是構成了這一經濟時代的基石
近代三次工業技術革命分別是
1、第一次工業革命,又叫產業革命,是指資本主義由工場手工業過渡到大機器生產,在生產領域和 社會 關繫上引起了根本性變化。
2、第二次工業革命,19世紀中期,歐洲國家和美國、日本的資產階級革命或改革的完成,促進了經濟的發展。19世紀60年代後期,開始第二次工業革命。人類進入了「電氣時代」。
3、第三次 科技 革命,20世紀四五十年代以來,在原子能、電子計算機、徽電子技術、航天技術、分子生物學和遺傳工程等領域取得的重大突破,標志著的科學技術的到來,這次科學技術在人類 歷史 上被稱為第三次技術革命。
歷史 是有周期性的,第四次 工業技術革命就在眼前,行業不外呼在那幾個, 歷史 技術革命浪潮帶來的改變關乎國家命運更關乎你我他!
在智能時代,
「數據」是新的生產資料,
「算力」是新生產力,
「演算法」是新生產關系,
構成了這一經濟時代的基石。
6. 知識+數據+算力:演算法進化升級的路徑是什麼|德外獨家
演算法融入信息傳播,帶來了傳播的深刻變革。推薦演算法基於大數據和人工智慧技術,通過演算法模型,進行信息與用戶的匹配,成為智能傳播中的主導力量。
然而,經過演算法過濾選擇後,匹配給用戶的信息對個人認知、判斷以及 社會 性的負面影響,引起了廣泛的關注和擔憂。
作者從智能傳播中演算法的缺陷入手,圍繞演算法優化和升級,與人工智慧行業專家、國家廣播電視總局廣播電視科學研究信息與安全技術研究所王磊博士,展開探討,以期為演算法進化找到可行路徑。
以下為兩人對談的詳細內容。
推薦演算法只能依從用戶
個人的偏好、需求嗎?
於烜: 演算法融入信息傳播,改變了信息採集、生產、分發和反饋等過程,帶來了傳播的深刻變革。在移動互聯網時代,演算法主導信息分發,演算法的個性化推薦(簡稱推薦演算法),有效應對了信息超載帶來的分發危機,解決了海量信息與用戶間的供需匹配問題,優化了生產和消費的資源配置效率,無疑是一種先進的技術和生產力。
但是, 推薦演算法存在一個明顯的缺陷。 我們知道在現代 社會 中,傳播的一個重要功能是實現 社會 整合,以傳統媒體為代表的大眾傳播發揮了 社會 整合的作用,傳媒能夠把不同階層、人群、族群凝聚起來,形成 社會 共識,這就是媒體公共性的體現。
然而,個性化演算法推薦,依據的是網路中用戶本人或相似人群的個人興趣、愛好、習慣、需求,只體現了個性,缺少公共性, 公共性缺席是演算法主導信息傳播的一個明顯的缺陷。推薦演算法只能依從用戶個人的偏好、需求嗎?
王磊:從技術上說,演算法是一種中介, 通過演算法模型,將信息與用戶進行匹配,本質是要解決信息和用戶的精準匹配問題。無論是傳統的機器學習演算法,還是近年來興起的深度學習演算法,通過用戶個人屬性和網路應用使用過程中的數據記錄,挖掘用戶個人興趣、需求, 最終達成個人信息需求的精準匹配,這就是演算法的使命。
當演算法融入傳播,演算法主導的短視頻平台、資訊平台成為了媒體,作為媒體,需要傳播主流價值觀,需要承擔媒體公共性責任, 除了個性化的推薦,在演算法中應該體現出公共性,這是從媒體角度、傳播角度,對演算法的要求。
於烜: 目前的智能傳播中,演算法並沒有回應這樣的要求。也就是說,從傳播角度看,目前普遍應用的個性化推薦演算法技術自身是有缺憾的,換句話說, 僅僅依靠推薦演算法技術進行的傳播,是有缺陷的,需要進化。
王磊: 對,可以這樣理解。
於烜: 近年來,智能傳播中,經過演算法過濾選擇後匹配給用戶的信息,對個人認知、判斷以及 社會 性的負面影響,引起了傳播學研究的關注,比如信息繭房、演算法囚徒、圈層化,這些研究都提示了演算法帶來的風險。所以無論是從演算法技術自身的缺憾,還是演算法在現實傳播中帶來的問題兩個層面看,演算法需要升級。
王磊: 確實如此, 推薦類演算法需要從演算法技術路線和網路架構上進一步升級, 以嘗試解決上述問題。
演算法是否能夠發現用戶更全面多樣的內容?
於烜: 大眾傳播時代的信息也是要過經過媒體過濾選擇的,但是在新聞專業主義的准則下,信息選擇有明確的標准,要求客觀、平衡,以盡可能反映 社會 現實。
但是,演算法的根本邏輯是流量,以流量為目的進行信息匹配。研究表明,流量偏向情緒性、故事性、戲劇性內容,客觀、平衡這一新聞傳播大廈的基石已經被流量沖垮了。
100年後的今天,被演算法選擇的信息失衡、失真,擬態環境和現實世界不是越來越接近,相反卻是越來越偏離了。
演算法模型中,是否可以將客觀、平衡等專業價值觀要素導入進去?也就是說不僅僅找到迎合用戶表面的喜好,也能發現他潛在的需要,或者是他願意了解、也應該了解的更全面的這樣一些內容?在實現過程中面臨的困難和挑戰又是什麼?
王磊: 我想可以嘗試突破信息傳播失衡、失真的現狀,但是實現起來難度很大。 一種辦法是演算法+規則,即以現有深度學習演算法模型為基礎,將專業價值觀理念設定為相應規則,兩者結合形成新的計算模型,進行相應信息匹配。 但是,現實中難度很大。
還有一個辦法,需要通過技術演進來實現。從人工智慧發展歷程看, 現在正處於弱人工智慧時代, 即「數據+演算法」的時代,這一時期通過大量投喂數據,演算法精度較過去提高了很多,但是 存在一個難以破解的核心問題——無法解決海量數據之間的深層次語義層面的關聯關系,演算法的泛化能力比較差, 簡單說就是在一個數據集中的模型,運用在另一個相似數據集中,其效果會變差。
只有當技術演進到 「知識圖譜+演算法」 階段,能夠在數據間找到並建立起相應的關聯關系,破解數據語義層面的聯系,才有可能挖掘出用戶潛在的、多層次的需要,改變目前簡單迎合的狀況。
清華大學張鈸院士提出的第三代人工智慧,即 知識+數據+演算法+算力, 或許未來可以從這個方面突破,一定程度上彌補當前信息傳播中推薦類演算法的缺陷。
第二代人工智慧階段,
如何推動綜合評價體系建立?
於烜: 演算法驅動的內容平台通過組織生產和演算法分發,已然成為了智能傳播時代的主體,因此說需要通過規則導入,促使演算法進化。
目前個性化推薦演算法,強調的是迎合用戶個人個性化的精度,是不是可以從內容端的廣度進行考量, 比如說,內容的多樣性,讓觀點多樣、信源多樣、品類多樣的內容達到用戶?也就說是否可以通過內容的廣度,來體現新聞傳播客觀、平衡。
王磊: 是的, 除了精度,演算法的廣度應該成為一個評價指標,如對內容的非歧視性關聯推薦等。現階段綜合評價指標的合理設計將引導演算法不斷地優化升級。 當然,這些評價標準的制定也需要傳播學的專家加入,共同探討。
於烜: 如果要對今天的對話做一簡短小結,我想說,面對演算法技術的缺憾及引發的問題,演算法無疑需要進化。而演算法進化有賴於演算法技術自身的演進,有賴於演算法掌控者的倫理培養,有賴於監管部門的標准規范。同時,這需要學界、業界、政府共同努力。
編者按:
作者:於烜,北京廣播電視台高級編輯、新聞傳播學博士,德外5號特約作者。