-
玩大數據一定用得到的19款 Java 開源 Web 爬蟲
一、HeritrixHeritrix 是一個由 java 開發的、開源的網絡爬蟲,用戶可以使用它來從網上抓取想要的資源。其最出色之處在於它良好的可擴展性,方便用戶實現自己的抓取邏輯。WebLech有一個功能控制臺並採用多線程操作。WebLech是一個功能強大的Web站點下載與鏡像免費開源工具。它支持按功能需求來下載web站點並能夠儘可能模仿標準Web瀏覽器的行為。WebLech有一個功能控制臺並採用多線程操作。這款爬蟲足夠簡單,如果初學如果編寫爬蟲,可做入門參考。所以我選擇了用這個爬蟲開始我的研究。如果只是做要求不高的應用,也可試試。
-
51CTO電子雜誌《開發月刊》2011年5月刊發布
51CTO電子雜誌《開發月刊》2011年5月刊發布 2011年5月16日,51CTO開發頻道推出《開發月刊》電子雜誌。主要內容涵蓋Java、.NET、WEB開發、資料庫和移動開發等等。從技術細節到項目管理,方方面面為開發者服務。
-
51CTO學院—就是這麼高端、大次、上檔氣
打開電腦,有沒覺得自己只會網站追個偶像劇、上網衝個無聊浪,別說啥人工智慧、大數據了,就連Word、Excel、PPT,都是相顧無言淚兩行啊!不怕不怕,史上最牛~的學習網站「51CTO學院」,來解救你了,它擁有最實踐的課程,最專業的試題,最完整的學習路線,最強大的功能,最重要的是操作還簡單,看看,就是這麼高端、大次、上檔氣,讓你告別電腦小白不是夢!
-
開源BI工具Metabase安裝
Metabase團隊傾向於儘可能使用開源解決方案。下載 Metabase下載地址:http://www.metabase.com/start/jar.html驗證Java已安裝在啟動應用程式之前,必須驗證是否安裝了Java:java -version你應該看到如下輸出:java version "1.8.0_31"Java(TM) SE
-
Java程式設計師常用的10大構建工具
Jenkins ——用Java編寫的一個開源持續集成工具。項目是在和Oracle發生爭執後的來自於Hudson 的分支。Gradle ——一個開源的自動化構建系統,建立在Apache Ant和Maven Apache概念的基礎上,並引入了基於Groovy的特定領域語言(DSL),而不是使用Apache Maven宣布的項目配置XML形式。
-
1小時搞定BI數據可視化——Metabase開源大數據BI工具簡介
任何一個企業,其都少不了數據報表,而很多企業都是以Excel的形式存儲企業的數據,很多時候企業發生的問題便這樣沉默在了數據的海洋之中
-
深入理解Java關鍵字null
,用來標識一個不確定的對象。Java中變量的使用都遵循一個原則:先定義並且初始化後才可以使用。我們不能在定義int a後,不給a指定值,就去列印a的值,這對於引用類型變量也是適用的。有時候,我們定義一個引用類型變量,在剛開始的時候,無法給出一個確定的值,但程序可能會在try語句塊中初始化值。這時,可以先給變量指定一個null值,問題就解決了。
-
jSqlBox 1.0.7 版發布, 一個Java持久層工具
簡介 | IntroducejSqlBox是一個支持動態配置、多種SQL寫法、跨資料庫的Java持久層工具。運行於Java6及以上。 優點 | Advantages架構優良:模塊式架構,各個模塊都可以脫離jSqlBox單獨存在。跨資料庫:基於jDialects,支持70多種資料庫的分頁、函數變換,是Hibernate之外少有的自帶DDL生成功能的持久層工具。
-
一個Java高級工程師的進階之路
在比較正規的開發團隊中,UML是討論項目的交流工具,您要想做一個軟體工程師,您至少要能看懂,您要想做高級工程師,您要能通過它來描述您對項目的理解,儘管這不是必須,但卻很重要。站在高度分析問題這不是一個知識點,也不是通過書本就能學得到的。只所以提到這一點,是因為我比您還著急,我希望您更快的成為一個高級的軟體工程師,而不是一個一般的軟體工程師。
-
音樂家們的開源工具箱
下面閒言少敘,我們馬上了解這一系列面向音樂家們的開源工具。1.學習音樂理論無論大家擅長什麼樣的樂器,或者是否能夠接受將音樂以數位化形式呈現,了解基礎樂理知識都是非常重要的。而在編寫樂曲時,如果大家不知道該如何記錄樂譜,那麼將很難在這條藝術之路上順暢前行。
-
NLP、KG相關軟體、工具、資源匯總
/jieba):應該是應用最廣泛的一個中文分詞工具了。fastNLP(https://github.com/fastnlp/fastNLP):復旦大學開源的一個NLP模型訓練框架,基於torch。stanza(https://github.com/stanfordnlp/stanza/):史丹福大學NLP組開源的一個python NLP處理包,也提供了接口訪問Stanford CoreNLP
-
聚投訴網友投訴51CTO學院:51cto學院虛假宣傳aci營養師作用,讓人買...
2019年11月27日 21:30,呂女士發起對51CTO學院的投訴。截止發稿前,51CTO學院有效投訴11次。
-
介紹一款好用的java反編譯工具 - jd-gui
二方包是公司內部其它部門的產出物,雖然折騰些但協調下一般還是能查看到源碼的;三方包如果是開源的項目,也能找到源碼;但對於非開源項目的 jar 包,如果想查看源碼,就不得不用到反編譯工具了。目前市面上常見的java反編譯工具,及其官方連結如下:jad: https://varaneckas.com/jad/JadClipse: 基於jad 的適用於eclipse 的插件:http://jadclipse.sourceforge.net/wiki/index.php/Main_Pagejd-gui: http://java-decompiler.github.io
-
Java 問題定位方法和工具
點擊圖片,查看完整專題Java 進階:系統異常排查「三板斧」—CPU、Load、內存作者/分享人:Dora作為軟體工程師,對于衡量系統性能的常用指標:CPU 使用率、系統負載(Load)、響應時間(RT)、每秒查詢率(QPS)、並發數等,應該不陌生。
-
smart-doc 2.0.1 發布,Java 零註解 API 文檔生成工具
smart-doc是一款同時支持java restful api和apache dubbo rpc接口文檔生成的工具
-
GitHub 上那些值得一試的 Java 開源庫 - OSCHINA - 中文開源技術...
在這多達330,000個JAVA開源庫中,我收集了下面這些或許也值得你一試的Java開源庫。Strmen-java是一個字符串處理工具,你可以通過maven將它引入到項目中。除了Java本身的字符串處理方式外,我們還可以使用Apache Common Langs裡的StringUtils來簡化String的操作。
-
運維人員的解放---Docker快速部署 - 51CTO.COM
個人體會較深的兩處優點:1、 快速部署,傳統的部署模式是:安裝(包管理工具或者源碼包編譯)->配置->運行;Docker的部署模式是:複製-如 docker run -I -t debian /bin/bash命令,只會運行/bin/bash程序,其它的程序都不會運行,對於要跑多個程序的容器特別糾結。
-
你的Java 代碼對 JIT 編譯友好麼? - OSCHINA - 中文開源技術交流...
這裡我們介紹一款叫做Jarscan的工具來幫助我們檢測程序中有多少方法是對內聯友好的。Jarscan工具是分析JIT編譯的JITWatch開源工具套件中的一部分。和在運行時分析JIT日誌的主工具不同,Jarscan是一款靜態分析jar文件的工具。該工具的輸出結果格式為CSV,結果中包含了超過頻繁調用方法臨界值的方法等信息。