Xunsearch
Xunsearch 是一個高性能、全功能的全文檢索解決方案。
Xunsearch 旨在幫助一般開發(fā)者針對既有的海量數(shù)據(jù),快速而方便地建立自己的全文搜索引擎。
Xunsearch 中文譯名為“迅搜”,代碼中的經(jīng)常被縮寫為 XS,既是英文名稱的縮略也是中文聲母縮寫。這兒的“迅”是快速的意思,至少包含了兩層涵義:其一代表了搜索結果的響應能力,其二則為二次開發(fā)難度、速度。Xunsearch 采用結構化分層設計,包含后端服務、前端開發(fā)包兩大部分,層次清晰而不交叉。其中后端是采用 C/C++ 編寫的守護進程,而前端采用最為流行的腳本語言 PHP ,對于 web 搜索項目更為方便。具體參見架構設計。
Xunsearch 極大程度降低的搜索開發(fā)的難度,除了常規(guī)的中文分詞、字段檢索、布爾語法等功能外,還比其它免費的解決方案提供了用戶急需的相關搜索、拼音搜索、結果高亮、搜索建議等等。具體的清單請參見我們的功能列表。
Xunsearch 真正全面開源,并使用最流行的開源許可協(xié)議 GPL 發(fā)布。您可以免費獲取本項目的全部源代碼,自由的使用它,并在許可條件下修改和再分發(fā),具體參見授權聲明文件。
1. 應用領域□
前提是要有一定的 PHP (或其它對應的 SDK 語言) 開發(fā)能力,并備有 Unix 類型操作系統(tǒng)的服務器至少一臺。Xunsearch 可以幫助您建立各種行業(yè)門戶/垂直搜索、BBS 論壇搜索、CMS/Web站內搜索、文檔/文獻資料檢索,以及各種基于現(xiàn)有數(shù)據(jù)庫系統(tǒng)的全文檢索。
2. 歷史淵源□
大約在 2006 年創(chuàng)始人 hightman 開始了全文檢索的相關探索,先是發(fā)布了純 PHP 實現(xiàn)的中文分詞代碼,之后又推出了 MySQL/MyISAM 全文索引的中文分詞補丁 MyFT。經(jīng)過一系列不斷完善和改進后,于 2007 年正式發(fā)布中文分詞項目 scws 并一直維護至今。起初開發(fā)分詞的目的就是為了解決中文的全文檢索,全文檢索技術雖然已經(jīng)趨于成熟,但多為商業(yè)產(chǎn)品。免費開源、并且要好用的還真難找了,于是萌動了自己開發(fā)全文檢索的念頭。2008 年推出了比較粗糙的搜索解決方案 FTPHP,之后于 2010 年又開啟了 Xungle 項目,直接免去各種技術需求,為用戶提供包含軟硬環(huán)境在內的搜索服務。
在 Xungle 項目的運作過程中,我們發(fā)現(xiàn)還有大量的用戶出于各種原因,不得不自行解決搜索技術。此外,我們發(fā)現(xiàn)了國外一個優(yōu)秀的開源搜索引擎基礎庫 Xapian,它采用 C/C++ 開發(fā),并且性能卓越,久經(jīng)考驗。但是并沒有整合中文分詞,并且開發(fā)難度、復雜度也較大。于是我們下決心整合 Xapian 和 Scws,并在此基礎上提供更多、更常用的搜索功能。這就是 Xunsearch ,目前版本發(fā)布正在準備中,代碼也已托管到 github 中。
3. 開發(fā)團隊□
本項目由杭州云圣網(wǎng)絡科技公司創(chuàng)立并維護,同時也是唯一就 Xunsearch 提供相應的商業(yè)技術服務、支持的公司。4. 致謝□
是大量 xungle 用戶的提議促使我們開啟 xunsearch 項目,Xunsearch 的往后發(fā)展將離不開廣大用戶的支持,還要特別感謝在此其間義務參與 xunsearch 內測的一些朋友。Xunsearch 底層采用 C/C++ 編寫,其中用到了許多其它優(yōu)秀項目,在線特別感謝它們的團隊和作者。主要有以下幾個:
xapian-core 這是 Xunsearch 的底層索引設計方案
www.xunsearch.com - 2013-11-29 - 收藏
scws 默認內置的中文分詞解決方案
libevent 后端服務器的事件處理模型
nginx 搜索服務器的設計借鑒了 nginx 的方式,采用多進程、多線程混合用于處理高并發(fā)請求
Yii 非常優(yōu)秀的 PHP 開發(fā)框架,xunsearch 官網(wǎng)采用該框架,文檔組織形式也參考自 YiiXunsearch
Xunsearch 是一個高性能、全功能的全文檢索解決方案。
www.ftphp.com - 2013-11-29 - 收藏
? ? ? Xunsearch 旨在幫助一般開發(fā)者針對既有的海量數(shù)據(jù),快速而方便地建立自己的全文搜索引擎。
? ? ? ?Xunsearch 中文譯名為“迅搜”,代碼中的經(jīng)常被縮寫為 XS,既是英文名稱的縮略也是中文聲母縮寫。 這兒的“迅”是快速的意思,至少包含了兩層涵義:其一代表了搜索結果的響應能力,其二則為二次開發(fā)難度、速度。
? ? ? ?Xunsearch 采用結構化分層設計,包含后端服務、前端開發(fā)包兩大部分,層次清晰而不交叉。 其中后端是采用 C/C++ 編寫的守護進程,而前端采用最為流行的腳本語言 PHP ,對于 web 搜索項目更為方便。 具體參見架構設計。
? ? ? ?Xunsearch 極大程度降低的搜索開發(fā)的難度,除了常規(guī)的中文分詞、字段檢索、布爾語法等功能外, 還比其它免費的解決方案提供了用戶急需的相關搜索、拼音搜索、結果高亮、搜索建議等等。 具體的清單請參見我們的功能列表。
? ? ? Xunsearch 真正全面開源,并使用最流行的開源許可協(xié)議 GPL 發(fā)布。您可以免費獲取本項目的全部源代碼, 自由的使用它,并在許可條件下修改和再分發(fā),具體參見授權聲明文件。
推薦資訊
推薦站點
頭像寶
頭像寶免費為網(wǎng)友提供大量豐富、精美的QQ頭像、女生頭像、男生頭像、情侶頭像、非主流頭像、動漫頭像等,好看的頭像大全盡在頭像寶網(wǎng)站。
www.vstou.com鞭牛士
鞭牛士 - 專注報道互聯(lián)網(wǎng) BiaNews 欲知網(wǎng)編事,必上Bianews。我們是中國第一網(wǎng)絡編輯交流社區(qū)。為網(wǎng)絡編輯提供就業(yè)、實習、交流、分享平臺。門戶主編坐鎮(zhèn),解答網(wǎng)絡編輯疑問,近20000名網(wǎng)絡編輯幫助您成為最優(yōu)秀的網(wǎng)絡編輯員和網(wǎng)絡編輯師,同時,我們還為中國互聯(lián)網(wǎng)公司招聘網(wǎng)絡編輯,信息真實,圈子招聘成功率極高。北京網(wǎng)絡編輯培訓機構獨家發(fā)布網(wǎng)絡編輯的認證與培訓信息、網(wǎng)絡編輯的行業(yè)動態(tài)以及網(wǎng)絡編輯的職業(yè)能力測試等信息。
www.bianews.com新書城
新書城網(wǎng)上書店,上海地區(qū)專業(yè)的網(wǎng)上書店,主要經(jīng)營計算機、經(jīng)管會計、英語考研等圖書,上海地區(qū)提供送貨上門服務。
www.newbooks.com.cn中國教育裝備采購網(wǎng)
中國教育裝備采購網(wǎng)是教育裝備行業(yè)網(wǎng)站,提供教育裝備行業(yè)儀器儀表,分析儀器,標本模型,校用家具,機電設備超過1000000條產(chǎn)品信息與70000條廠商信息,每天更新500條以上行業(yè)招標與求購信息。
www.caigou.com.cn亞馬遜
亞馬遜中國(z.cn)是全球領先的電子商務公司亞馬遜在中國的網(wǎng)站。秉承“以客戶為中心”的理念,亞馬遜中國承諾“天天低價,正品行貨”,致力于從低價、選品、便利三個方面為消費者打造一個百分百可信賴的網(wǎng)上購物環(huán)境。作為一家在中國處于領先地位的電商,亞馬遜中國為消費者提供圖書、音樂、影視、手機數(shù)碼、家電、家居、玩具、健康、美容化妝、鐘表首飾、服飾箱包、鞋靴、 運動、食品、母嬰、戶外和休閑等29大類、上千萬種的產(chǎn)品,通過“貨到付款”等多種支付方式,為中國消費者提供便利、快捷的網(wǎng)購體驗。
www.amazon.cn
