發布時間:2021-12-28 15:50:19來源:有考培訓網綜合
上海Java培訓機構推薦哪家?“職坐標”平臺是海同科技以14年教學經驗傾心打造的以“項目實訓”模式為核心的教學平臺。與2000+企業,包括阿里、華為、海信、交通銀行、今日頭條等企業進行人才服務合作;同時,也與300+高校達成合作,為全國高校師生提供優質課程資源、督學服務和平臺支持。
1、WikipediaSearch。
一部大眾百科全書應該運行在開源軟件上,并且具有一個由Java驅動的搜索引擎,這是再合適不過的了。Lucene是由DougCutting于1999年編寫,并以他妻子的中間名命名的,它實際上是Cutting開發的第五個搜索引擎。他作為工程師先后為XeroxPARC(施樂帕克研究中心)、Apple和Excite創建了其他的引擎。2014年,Wikipedia用Elasticsearch代替了Lucene引擎,Elasticsearch是一個分布式的、支持REST的搜索引擎,也是用Java編寫的。
2、Hadoop。
Lucene并不是一個進入我們這個榜單的Cutting創建的作品。2003年,Google在一篇研究論文中描述了在大型商用計算機集群上處理數據的MapReduce算法,受該論文的啟發,Cutting用Java編寫了一個MapReduce操作開源框架,并以他兒子的玩具大象命名,稱為Hadoop。Hadoop1.0于2006年發布,催生了大數據趨勢,并激發了許多公司開始收集“數據湖”(datalakes),制定挖掘“數據排放”(dataexhaust)的策略,并將數據描述為“新石油”(thenewoil)。到2008年,Yahoo(當時的Cutting曾在該公司工作)宣稱他們的SearchWebmap運行在10,000個內核的Linux群集上,是現有的較大的產線Hadoop應用程序。到2012年,Facebook聲稱在全球較大的Hadoop集群上擁有超過100PB的數據。
3、并行圖形分析(ParallelGraphAnalytiX,PGX)。
圖形分析是有關理解數據中的關系和連接的。根據基準測試,PGX是世界上速度較快的圖形分析引擎之一。PGX是用Java編寫的,由OracleLabs研究員SungpackHong領導的團隊于2014年首次發布,PGX允許用戶加載圖形數據并運行分析算法,比如,社區發現(CommunityDetection)、聚類、路徑查找、頁面排名、影響因素分析、異常檢測、路徑分析和模式匹配等算法。在健康、安全、零售和金融領域,它的用例比比皆是。
4、H2O.ai。
機器學習(ML)的曲線非常陡峭,這可能會阻止領域實現偉大的ML想法。自動化ML(AutoML)可以通過推斷ML流程中的某些步驟(例如特征工程、模型訓練和調整以及轉譯等)來提供一些幫助。由JavaCliffClick創建的基于Java的開源H2O.ai平臺,旨在實現AI的大眾化,并能為那些剛入門的人們充當虛擬數據科學家,同時能幫助ML提率。