北京翻譯公司:英語(yǔ)‖日語(yǔ)‖韓語(yǔ)‖俄語(yǔ)‖德語(yǔ)‖法語(yǔ)‖口譯同傳4006669109

北京翻譯公司:英語(yǔ)‖日語(yǔ)‖韓語(yǔ)‖俄語(yǔ)‖德語(yǔ)‖法語(yǔ)‖口譯同傳4006669109
大數據翻譯英語(yǔ)常用詞匯總結之二 當前位置:首頁(yè) >  翻譯知識

大數據(big data,mega data)或稱(chēng)巨量資料,指的是需要新處理模式才能具有更強的決策力、洞察力和流程優(yōu)化能力的海量、高增長(cháng)率和多樣化的信息資產(chǎn)。 在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫(xiě)的《大數據時(shí)代》中大數據指不用隨機分析法(抽樣調查)這樣的捷徑,而采用所有數據進(jìn)行分析處理。大數據的5V特點(diǎn):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價(jià)值密度)、Veracity(真實(shí)性)。隨著(zhù)人工智能的大量應用,大數據翻譯也應用廣泛起來(lái),下來(lái)海歷陽(yáng)光翻譯公司簡(jiǎn)單總結一些大數據的常用詞匯。

 

IT翻譯.jpg

??二十六:CPA(廣告術(shù)語(yǔ))

  ??CPA(Cost Per Action)是一種廣告計費模式,顧名思義按照行為(Action)作為指標來(lái)計費,這個(gè)行為可以是注冊、咨詢(xún)、放入購物車(chē)等等。廣告公司和媒體公司常用CPA、CPC(Cost Per Click)、CPM(Cost Per Mille,或者Cost Per Thousand;Cost Per Impressions)一起來(lái)衡量廣告價(jià)格。

  ??CPA(每次行動(dòng)成本,Cost Per Action)計價(jià)方式是指按廣告投放實(shí)際效果,即按回應的有效問(wèn)卷或定單來(lái)計費,而不限廣告投放量。CPA廣告是網(wǎng)絡(luò )中最常見(jiàn)的一種廣告形式,當用戶(hù)點(diǎn)擊某個(gè)網(wǎng)站上的cpc廣告后,這個(gè)站的站長(cháng)就會(huì )獲得相應的收入。

 

??二十七:CPT(廣告術(shù)語(yǔ))

  ??按時(shí)長(cháng)計費是包時(shí)段投放廣告的一種形式,廣告主選擇廣告位和投放時(shí)間,費用與廣告點(diǎn)擊量無(wú)關(guān)。采用這種方式出售廣告,網(wǎng)站主決定每一個(gè)廣告位的價(jià)格,廣告主自行選擇購買(mǎi)時(shí)間段,目前可按周或按天購買(mǎi),成交價(jià)就是網(wǎng)站主標定的價(jià)格。

 

??二十八:CTR(廣告點(diǎn)擊率)

  ??CTR(Click-Through-Rate)互聯(lián)網(wǎng)廣告常用的術(shù)語(yǔ),指網(wǎng)絡(luò )廣告(圖片廣告/文字廣告/關(guān)鍵詞廣告/排名廣告/視頻廣告等)的點(diǎn)擊到達率,即該廣告的點(diǎn)擊量(嚴格的來(lái)說(shuō),可以是到達目標頁(yè)面的數量)除以廣告的瀏覽量(PV- Page View)。

  ??CTR是衡量互聯(lián)網(wǎng)廣告效果的一項重要指標。

 

??二十九:算法

  ??算法(Algorithm)是指解題方案的準確而完整的描述,是一系列解決問(wèn)題的清晰指令,算法代表著(zhù)用系統的方法描述解決問(wèn)題的策略機制。也就是說(shuō),能夠對一定規范的輸入,在有限時(shí)間內獲得所要求的輸出。如果一個(gè)算法有缺陷,或不適合于某個(gè)問(wèn)題,執行這個(gè)算法將不會(huì )解決這個(gè)問(wèn)題。不同的算法可能用不同的時(shí)間、空間或效率來(lái)完成同樣的任務(wù)。一個(gè)算法的優(yōu)劣可以用空間復雜度與時(shí)間復雜度來(lái)衡量。

 

??三十:機器學(xué)習

  ??機器學(xué)習(Machine Learning, ML)是一門(mén)多領(lǐng)域交叉學(xué)科,涉及概率論、統計學(xué)、逼近論、凸分析、算法復雜度理論等多門(mén)學(xué)科。專(zhuān)門(mén)研究計算機怎樣模擬或實(shí)現人類(lèi)的學(xué)習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。

  ??它是人工智能的核心,是使計算機具有智能的根本途徑,其應用遍及人工智能的各個(gè)領(lǐng)域,它主要使用歸納、綜合而不是演繹。

 

??三十一:人工智能

  ??人工智能(Artificial Intelligence) ,英文縮寫(xiě)為AI。它是研究、開(kāi)發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術(shù)及應用系統的一門(mén)新的技術(shù)科學(xué)。 人工智能是計算機科學(xué)的一個(gè)分支,它企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以人類(lèi)智能相似的方式做出反應的智能機器,該領(lǐng)域的研究包括機器人、語(yǔ)言識別、圖像識別、自然語(yǔ)言處理和專(zhuān)家系統等。人工智能從誕生以來(lái),理論和技術(shù)日益成熟,應用領(lǐng)域也不斷擴大,可以設想,未來(lái)人工智能帶來(lái)的科技產(chǎn)品,將會(huì )是人類(lèi)智慧的“容器”。

 

??三十二:深度學(xué)習

  ??英文名:Deep Learning

  ??深度學(xué)習的概念源于人工神經(jīng)網(wǎng)絡(luò )的研究。含多隱層的多層感知器就是一種深度學(xué)習結構。深度學(xué)習通過(guò)組合低層特征形成更加抽象的高層表示屬性類(lèi)別或特征,以發(fā)現數據的分布式特征表示。

  ??深度學(xué)習的概念由Hinton等人于2006年提出?;谏钚哦染W(wǎng)(DBN)提出非監督貪心逐層訓練算法,為解決深層結構相關(guān)的優(yōu)化難題帶來(lái)希望,隨后提出多層自動(dòng)編碼器深層結構。此外Lecun等人提出的卷積神經(jīng)網(wǎng)絡(luò )是第一個(gè)真正多層結構學(xué)習算法,它利用空間相對關(guān)系減少參數數目以提高訓練性能。

  ??深度學(xué)習是機器學(xué)習研究中的一個(gè)新的領(lǐng)域,其動(dòng)機在于建立、模擬人腦進(jìn)行分析學(xué)習的神經(jīng)網(wǎng)絡(luò ),它模仿人腦的機制來(lái)解釋數據,例如圖像,聲音和文本。

 

??三十四:神經(jīng)網(wǎng)絡(luò )

  ??人工神經(jīng)網(wǎng)絡(luò )(Artificial Neural Networks,簡(jiǎn)寫(xiě)為ANNs)也簡(jiǎn)稱(chēng)為神經(jīng)網(wǎng)絡(luò )(NNs)或稱(chēng)作連接模型(Connection Model),它是一種模仿動(dòng)物神經(jīng)網(wǎng)絡(luò )行為特征,進(jìn)行分布式并行信息處理的算法數學(xué)模型。這種網(wǎng)絡(luò )依靠系統的復雜程度,通過(guò)調整內部大量節點(diǎn)之間相互連接的關(guān)系,從而達到處理信息的目的。

 

??三十五:OpenStack

  ??OpenStack是一個(gè)由NASA(美國國家航空航天局)和Rackspace合作研發(fā)并發(fā)起的,以Apache許可證授權的自由軟件和開(kāi)放源代碼項目。

  ??OpenStack是一個(gè)開(kāi)源的云計算管理平臺項目,由幾個(gè)主要的組件組合起來(lái)完成具體工作。OpenStack支持幾乎所有類(lèi)型的云環(huán)境,項目目標是提供實(shí)施簡(jiǎn)單、可大規模擴展、豐富、標準統一的云計算管理平臺。OpenStack通過(guò)各種互補的服務(wù)提供了基礎設施即服務(wù)(IaaS)的解決方案,每個(gè)服務(wù)提供API以進(jìn)行集成。

 

??三十六:SaaS

  ??SaaS是Software-as-a-Service(軟件即服務(wù))的簡(jiǎn)稱(chēng),隨著(zhù)互聯(lián)網(wǎng)技術(shù)的發(fā)展和應用軟件的成熟, 在21世紀開(kāi)始興起的一種完全創(chuàng )新的軟件應用模式。它與“on-demand software”(按需軟件),the application service provider(ASP,應用服務(wù)提供商),hosted software(托管軟件)所具有相似的含義。它是一種通過(guò)Internet提供軟件的模式,廠(chǎng)商將應用軟件統一部署在自己的服務(wù)器上,客戶(hù)可以根據自己實(shí)際需求,通過(guò)互聯(lián)網(wǎng)向廠(chǎng)商定購所需的應用軟件服務(wù),按定購的服務(wù)多少和時(shí)間長(cháng)短向廠(chǎng)商支付費用,并通過(guò)互聯(lián)網(wǎng)獲得廠(chǎng)商提供的服務(wù)。

 

??三十七:Paas

  ??PaaS是Platform-as-a-Service的縮寫(xiě),意思是平臺即服務(wù)。 把服務(wù)器平臺作為一種服務(wù)提供的商業(yè)模式。通過(guò)網(wǎng)絡(luò )進(jìn)行程序提供的服務(wù)稱(chēng)之為SaaS(Software as a Service),而云計算時(shí)代相應的服務(wù)器平臺或者開(kāi)發(fā)環(huán)境作為服務(wù)進(jìn)行提供就成為了PaaS(Platform as a Service)。

  ??所謂PaaS實(shí)際上是指將軟件研發(fā)的平臺(計世資訊定義為業(yè)務(wù)基礎平臺)作為一種服務(wù),以SaaS的模式提交給用戶(hù)。因此,PaaS也是SaaS模式的一種應用。但是,PaaS的出現可以加快SaaS的發(fā)展,尤其是加快SaaS應用的開(kāi)發(fā)速度。在2007年國內外SaaS廠(chǎng)商先后推出自己的PAAS平臺。

 

??三十八:IaaS

 

??IaaS(Infrastructure as a Service),即基礎設施即服務(wù)。

  ??消費者通過(guò)Internet 可以從完善的計算機基礎設施獲得服務(wù)。這類(lèi)服務(wù)稱(chēng)為基礎設施即服務(wù)?;?Internet 的服務(wù)(如存儲和數據庫)是 IaaS的一部分。Internet上其他類(lèi)型的服務(wù)包括平臺即服務(wù)(Platform as a Service,PaaS)和軟件即服務(wù)(Software as a Service,SaaS)。PaaS提供了用戶(hù)可以訪(fǎng)問(wèn)的完整或部分的應用程序開(kāi)發(fā),SaaS則提供了完整的可直接使用的應用程序,比如通過(guò) Internet管理企業(yè)資源。

 

??三十九:HaaS

  ??以提供的Hadoop作為一種服務(wù)(HAAS)

  ??HaaS(Hardware-as-a-service)的意思是硬件即服務(wù)。HaaS概念的出現源于云計算,現在被稱(chēng)作基礎架構即服務(wù)(IaaS)或基礎架構云,使用IaaS,各企業(yè)可通過(guò)Web將更多的基礎架構容量作為服務(wù)提供?!巴ㄟ^(guò)Web”分配更多的存儲或處理容量當然要比供應商在基礎環(huán)境中引入和安裝新硬件要快得多。HaaS還具有另外一層含義是針對嵌入式設備而言的,目的在于建立通過(guò)互聯(lián)網(wǎng)(Web)進(jìn)行嵌入式設備統一管理服務(wù)的模式。在這種情況下,HaaS類(lèi)似于SaaS,對于嵌入式設備使用者來(lái)說(shuō),無(wú)需對所需嵌入式設備進(jìn)行一次性購買(mǎi),僅需按照設備使用量或其它標準支付設備的服務(wù)費及維護費即可。

 

??四十:決策樹(shù)

  ??決策樹(shù)(Decision Tree)是在已知各種情況發(fā)生概率的基礎上,通過(guò)構成決策樹(shù)來(lái)求取凈現值的期望值大于等于零的概率,評價(jià)項目風(fēng)險,判斷其可行性的決策分析方法,是直觀(guān)運用概率分析的一種圖解法。由于這種決策分支畫(huà)成圖形很像一棵樹(shù)的枝干,故稱(chēng)決策樹(shù)。在機器學(xué)習中,決策樹(shù)是一個(gè)預測模型,他代表的是對象屬性與對象值之間的一種映射關(guān)系。Entropy = 系統的凌亂程度,使用算法ID3, C4.5和C5.0生成樹(shù)算法使用熵。這一度量是基于信息學(xué)理論中熵的概念。

 

??四十一:EM算法

  ??最大期望算法(Expectation Maximization Algorithm,又譯期望最大化算法),是一種迭代算法,用于含有隱變量(hidden variable)的概率參數模型的最大似然估計或極大后驗概率估計。

 

??四十二:數據聚類(lèi)

  ??數據聚類(lèi) (英語(yǔ) : Cluster analysis) 是對于靜態(tài)數據分析的一門(mén)技術(shù),在許多領(lǐng)域受到廣泛應用,包括機器學(xué)習,數據挖掘,模式識別,圖像分析以及生物信息。聚類(lèi)是把相似的對象通過(guò)靜態(tài)分類(lèi)的方法分成不同的組別或者更多的子集(subset),這樣讓在同一個(gè)子集中的成員對象都有相似的一些屬性,常見(jiàn)的包括在坐標系中更加短的空間距離等。

 

??四十三:概率模型

  ??給定一個(gè)用戶(hù)的查詢(xún)串,相對于該串存在一個(gè)包含所有相關(guān)文檔的集合。我們把這樣的集合看作是一個(gè)理想的結果文檔集,在給出理想結果集后,我們能很容易得到結果文檔。這樣我們可以把查詢(xún)處理看作是對理想結果文檔集屬性的處理。問(wèn)題是我們并不能確切地知道這些屬性,我們所知道的是存在索引術(shù)語(yǔ)來(lái)表示這些屬性。由于在查詢(xún)期間這些屬性都是不可見(jiàn)的,這就需要在初始階段來(lái)估計這些屬性。這種初始階段的估計允許我們對首次檢索的文檔集合返回理想的結果集,并產(chǎn)生一個(gè)初步的概率描述。

 

??四十四:貝索斯定律

  ??英文:Bezos’ Law

  ??貝索斯定律是指在云的發(fā)展過(guò)程中,單位計算能力的價(jià)格大約每隔3年會(huì )降低50%。

 

??四十五:回歸分析

  ??回歸分析(regression analysis)是確定兩種或兩種以上變量間相互依賴(lài)的定量關(guān)系的一種統計分析方法。運用十分廣泛,回歸分析按照涉及的自變量的多少,可分為一元回歸分析和多元回歸分析;按照自變量和因變量之間的關(guān)系類(lèi)型,可分為線(xiàn)性回歸分析和非線(xiàn)性回歸分析。如果在回歸分析中,只包括一個(gè)自變量和一個(gè)因變量,且二者的關(guān)系可用一條直線(xiàn)近似表示,這種回歸分析稱(chēng)為一元線(xiàn)性回歸分析。如果回歸分析中包括兩個(gè)或兩個(gè)以上的自變量,且因變量和自變量之間是線(xiàn)性關(guān)系,則稱(chēng)為多元線(xiàn)性回歸分析。

 

??四十六:推薦算法

  ??基于內容的信息推薦方法的理論依據主要來(lái)自于信息檢索和信息過(guò)濾,所謂的基于內容的推薦方法就是根據用戶(hù)過(guò)去的瀏覽記錄來(lái)向用戶(hù)推薦用戶(hù)沒(méi)有接觸過(guò)的推薦項。主要是從兩個(gè)方法來(lái)描述基于內容的推薦方法:?jiǎn)l(fā)式的方法和基于模型的方法。啟發(fā)式的方法就是用戶(hù)憑借經(jīng)驗來(lái)定義相關(guān)的計算公式,然后再根據公式的計算結果和實(shí)際的結果進(jìn)行驗證,然后再不斷修改公式以達到最終目的。而對于模型的方法就是根據以往的數據作為數據集,然后根據這個(gè)數據集來(lái)學(xué)習出一個(gè)模型。

 

??四十七:八叉樹(shù)

  ??英文名:Octree

  ??八叉樹(shù)是一種用于描述三維空間的樹(shù)狀數據結構。八叉樹(shù)的每個(gè)節點(diǎn)表示一個(gè)正方體的體積元素,每個(gè)節點(diǎn)有八個(gè)子節點(diǎn),將八個(gè)子節點(diǎn)所表示的體積元素加在一起就等于父節點(diǎn)的體積。

 

??四十八:紅黑樹(shù)

  ??紅黑樹(shù)(Red Black Tree) 是一種自平衡二叉查找樹(shù),是在計算機科學(xué)中用到的一種數據結構,典型的用途是實(shí)現關(guān)聯(lián)數組。

  ??它是在1972年由Rudolf Bayer發(fā)明的,當時(shí)被稱(chēng)為平衡二叉B樹(shù)(symmetric binary B-trees)。后來(lái),在1978年被 Leo J. Guibas 和 Robert Sedgewick 修改為如今的“紅黑樹(shù)”。

  ??紅黑樹(shù)和AVL樹(shù)類(lèi)似,都是在進(jìn)行插入和刪除操作時(shí)通過(guò)特定操作保持二叉查找樹(shù)的平衡,從而獲得較高的查找性能。

  ??它雖然是復雜的,但它的最壞情況運行時(shí)間也是非常良好的,并且在實(shí)踐中是高效的: 它可以在O(log n)時(shí)間內做查找,插入和刪除,這里的n 是樹(shù)中元素的數目。

 

??四十九:哈希表

  ??散列表(Hash table,也叫哈希表),是根據關(guān)鍵碼值(Key value)而直接進(jìn)行訪(fǎng)問(wèn)的數據結構。也就是說(shuō),它通過(guò)把關(guān)鍵碼值映射到表中一個(gè)位置來(lái)訪(fǎng)問(wèn)記錄,以加快查找的速度。這個(gè)映射函數叫做散列函數,存放記錄的數組叫做散列表。

  ??給定表M,存在函數f(key),對任意給定的關(guān)鍵字值key,代入函數后若能得到包含該關(guān)鍵字的記錄在表中的地址,則稱(chēng)表M為哈希(Hash)表,函數f(key)為哈希(Hash) 函數。

 

??五十:隨機森林

  ??英文名:Random forest

  ??在機器學(xué)習中,隨機森林是一個(gè)包含多個(gè)決策樹(shù)的分類(lèi)器, 并且其輸出的類(lèi)別是由個(gè)別樹(shù)輸出的類(lèi)別的眾數而定。 Leo Breiman和Adele Cutler發(fā)展出推論出隨機森林的算法。 而 “Random Forests” 是他們的商標。 這個(gè)術(shù)語(yǔ)是1995年由貝爾實(shí)驗室的Tin Kam Ho所提出的隨機決策森林(random decision forests)而來(lái)的。這個(gè)方法則是結合 Breimans 的 “Bootstrap aggregating” 想法和 Ho 的”random subspace method”” 以建造決策樹(shù)的集合。

 

以上就是海歷陽(yáng)光翻譯公司就大數據翻譯英語(yǔ)常用詞匯總結之二的介紹,如果您有大數據翻譯的需求請聯(lián)系我們,海歷陽(yáng)光翻譯將竭誠為您服務(wù)。




A一级无码免费黄色视频_深夜在线观看av_高清无码在线看片_国产精品自产拍在线