當前位置:
首頁 > 科技 > 如果大數據學會了多門外語,有什麼用?

如果大數據學會了多門外語,有什麼用?

「大數據」三個字想必大家並不陌生。

一般來說,2013年被定義為「大數據元年」,如今4年過去,大數據逐漸從相對空洞的商業術語中脫離出來深入到各個領域。近期如火如荼儼然「紅海」的共享單車市場,人們在享受出行方式的改變背後,公司之間的競爭從投放量亦慢慢走向數據的博弈。如同一門綜合性學科一般,單純的數據堆砌早已沒有意義,如何挖掘、分析與應用,才可能擁有數據的價值;而此時在演算法趨同的趨勢下,數據的質量與規模則成為兵家必爭之地。

上面的說法倒是也新鮮,但是大家可能忽略的一個問題是:「大數據總是站在更大數據的陰影之下。」

在一般理解里,大數據前面可能還缺「中文」二字。也就是說,日常所謂的大數據通常情況下指的都是中文大數據。

有這樣一組數字:當下全球互聯網用戶已超過30億,佔全球總人口的40%。然而在如此龐大的用戶規模中,卻有接近90%以上的網民不具備母語以外的語言技能,並且其中59.4%以上的用戶具有跨語言、交友、獲取新聞信息等需求。

因此,儘管大數據產業已步入多元化、垂直化發展階段,但目前絕大多數大數據還囿於單一語種,而那些散落在全球範圍內的多語種價值尚沉睡海底。這種需求等差,使得跨語言大數據的應用價值日顯關鍵,小到商業數據分析,大到國與國之間的互通合作,跨越了語言符號的大數據已不容小覷。

跨語言大數據的差異化價值

語言是一切溝通的基礎,其所蘊含的信息量十分龐大,而通過對語料的收集、處理與分析,則能從數據源頭抓取跨語言大數據的價值,打破單一語種的局限,以可視化、宏觀化的方式滿足各行各業之於數據的需求。

「在網路使用者正常的關鍵詞搜索過程中,無論搜索結果是多少條,人們的閱讀習慣常常是幾條或者幾十條,且語言單一。譯見大數據要做的是不僅僅要去除掉所有語言標籤,讓用戶能夠搜到全球的相關信息,更要把搜索到的所有幾十萬條、幾百萬條數據都能夠定性定量地分析。」 中譯語通CEO于洋曾在採訪中表示。

中譯語通以翻譯起家,「在現有的語種以及諸多垂直領域已經具備了正面PK谷歌翻譯的能力」,而去年7月份發布的大數據平台「譯見」,則整合了機器翻譯、語義分析、智能采編、數據挖掘等十餘種自然語言處理、大數據和人工智慧技術,在跨語言大數據領域深耕。

其不僅在各大行業展會、學術交流中嶄露頭角,倡導跨語言大數據共融理念;更是與國際優秀企業簽約合作,與頂尖人工智慧專家分享在AI語言科技所取得的研發成果。

跨語言大數據與行業如何融合?7月29日,中譯語通將舉辦「幻化·2017中譯語通戰略發布會」,屆時將發布與跨語言大數據相關的重磅新品,同時還將舉行多場高峰論壇,就人工智慧、大數據、語言科技等話題與業內專家、學者進行探討。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 虎嗅APP 的精彩文章:

特朗普說庫克同意在美建三座大廠,Made in USA 的製造能力還真讓人擔憂
找來吳亦凡的小米,分分鐘都在對標 OPPO和vivo
華誼兄弟「水」過的上半年:電影業務頹靡,盈利全靠出售資產
金庸小說里少林寺除了達摩院,還有哪些內設的機構?
雷軍最在乎的,還是小米手機出貨量

TAG:虎嗅APP |

您可能感興趣

大數據學習入門看什麼書?學會大數據可以解決哪些問題?
大數據學習路線哪家好?大數據需要學什麼
自學大數據如何入手?大數據學習入門看什麼書?
大數據學習入門看什麼書?大數據新手怎麼入門?
大數據學習教程:五大核心技術有哪些?
完整的大數據知識體系,大數據學習路線圖
透過 AutoML 建立模型,數據學家讓機器看拉麵照片就知道是哪家分店
大數據學習指南
大數據學習氛圍濃厚 貴州人最愛讀的書竟是《塊數據 2.0》
2018零基礎轉行大數據怎麼學習?大數據學習路線
深度 | 從規則推理到數據學習:人工智慧該學習人類的思維方式嗎?
大數據學習路線
大數據學習資料,Hadoop技術的優缺點
完整的大數據學習路線
線性代數與數據學習:MIT教授Gilbert Strang幫你打下堅實的數學基礎
《文獻與數據學報》創刊