Xunsearch
Xunsearch 是一個高性能、全功能的全文檢索解決方案。
Xunsearch 旨在幫助一般開發者針對既有的海量數據,快速而方便地建立自己的全文搜索引擎。
Xunsearch 中文譯名為“迅搜”,代碼中的經常被縮寫為 XS,既是英文名稱的縮略也是中文聲母縮寫。這兒的“迅”是快速的意思,至少包含了兩層涵義:其一代表了搜索結果的響應能力,其二則為二次開發難度、速度。Xunsearch 采用結構化分層設計,包含后端服務、前端開發包兩大部分,層次清晰而不交叉。其中后端是采用 C/C++ 編寫的守護進程,而前端采用最為流行的腳本語言 PHP ,對于 web 搜索項目更為方便。具體參見架構設計。
Xunsearch 極大程度降低的搜索開發的難度,除了常規的中文分詞、字段檢索、布爾語法等功能外,還比其它免費的解決方案提供了用戶急需的相關搜索、拼音搜索、結果高亮、搜索建議等等。具體的清單請參見我們的功能列表。
Xunsearch 真正全面開源,并使用最流行的開源許可協議 GPL 發布。您可以免費獲取本項目的全部源代碼,自由的使用它,并在許可條件下修改和再分發,具體參見授權聲明文件。
1. 應用領域□
前提是要有一定的 PHP (或其它對應的 SDK 語言) 開發能力,并備有 Unix 類型操作系統的服務器至少一臺。Xunsearch 可以幫助您建立各種行業門戶/垂直搜索、BBS 論壇搜索、CMS/Web站內搜索、文檔/文獻資料檢索,以及各種基于現有數據庫系統的全文檢索。
2. 歷史淵源□
大約在 2006 年創始人 hightman 開始了全文檢索的相關探索,先是發布了純 PHP 實現的中文分詞代碼,之后又推出了 MySQL/MyISAM 全文索引的中文分詞補丁 MyFT。經過一系列不斷完善和改進后,于 2007 年正式發布中文分詞項目 scws 并一直維護至今。起初開發分詞的目的就是為了解決中文的全文檢索,全文檢索技術雖然已經趨于成熟,但多為商業產品。免費開源、并且要好用的還真難找了,于是萌動了自己開發全文檢索的念頭。2008 年推出了比較粗糙的搜索解決方案 FTPHP,之后于 2010 年又開啟了 Xungle 項目,直接免去各種技術需求,為用戶提供包含軟硬環境在內的搜索服務。
在 Xungle 項目的運作過程中,我們發現還有大量的用戶出于各種原因,不得不自行解決搜索技術。此外,我們發現了國外一個優秀的開源搜索引擎基礎庫 Xapian,它采用 C/C++ 開發,并且性能卓越,久經考驗。但是并沒有整合中文分詞,并且開發難度、復雜度也較大。于是我們下決心整合 Xapian 和 Scws,并在此基礎上提供更多、更常用的搜索功能。這就是 Xunsearch ,目前版本發布正在準備中,代碼也已托管到 github 中。
3. 開發團隊□
本項目由杭州云圣網絡科技公司創立并維護,同時也是唯一就 Xunsearch 提供相應的商業技術服務、支持的公司。4. 致謝□
是大量 xungle 用戶的提議促使我們開啟 xunsearch 項目,Xunsearch 的往后發展將離不開廣大用戶的支持,還要特別感謝在此其間義務參與 xunsearch 內測的一些朋友。Xunsearch 底層采用 C/C++ 編寫,其中用到了許多其它優秀項目,在線特別感謝它們的團隊和作者。主要有以下幾個:
xapian-core 這是 Xunsearch 的底層索引設計方案
www.xunsearch.com - 2013-11-29 - 收藏
scws 默認內置的中文分詞解決方案
libevent 后端服務器的事件處理模型
nginx 搜索服務器的設計借鑒了 nginx 的方式,采用多進程、多線程混合用于處理高并發請求
Yii 非常優秀的 PHP 開發框架,xunsearch 官網采用該框架,文檔組織形式也參考自 YiiStumbleUpon
StumbleUpon是個社交化網頁推薦引擎。就是說,StumbleUpon是推薦網頁的,稱其“社交化”是因為推薦網頁的動力是用戶。就是說你在使用StumbleUpon的時候,所推薦的網頁是來自用戶,而你也可以通過簡單的“喜歡”或“不喜歡”對網頁推薦。同時你也可以將此網頁在Facebook,Twitter,郵件中分享,或通過Facebook賬戶和郵件發現其它的 Stumbler。
在StumbleUpon上最受歡迎的內容傾向于易于吸收的和娛樂性的內容。排名、怪事、科學發現、動物、幽默、圖片等。2009 年用戶推薦最多的內容包括“互聯網上你應該看到的 99 件事情,” “以四個瓶子總結人生”、“來自 FAS-OWI 的14張稀有彩照。”
StumbleUpon可以說是一個從瀏覽器的工具條插件發展起來的網站,其主要功能的80%以上都是由一個小小的插件完成。它是2001年由三個加拿大軟件工程師創辦,一開始在加拿大,后來隨著網站壯大,到了美國發展。在2006年末以前僅僅提供firefox插件,后來才推出IE瀏覽器的插件。裝上之后會在瀏覽器上出現一個工具條,每次點擊\"Stumble”按鈕,瀏覽器里都會出現一個讓你耳目一新的網頁。如果你看到自己非常喜歡的網頁,可以點一下 \"I like it”大拇指形狀的按鈕,給它投票。這種投票有2個用處: 1)與己的好處:網站會根據你給哪些網頁投過票,推斷你的喜好,下次給你呈現你可能會喜歡的網頁; 2)與人的好處:得票越多的網頁就是越精彩的網頁,當其他用戶點Stumble按鈕時就會越優先呈現出來。StumbleUpon最好的功能就是每一次給你推薦出來的網頁都是很符合你的胃口的。
StumbleUpon的使用非常簡單,你可以在網頁上使用,但是最好的方式是安裝一個瀏覽器插件,設置好自己感興趣的網站類別(科技、藝術、娛樂、影視等),直接點擊 Stumble! 按鈕,StumbleUpon的推薦引擎將給你推薦一個網頁,如果你不喜歡,再點擊一下。Stumbleupon提供了一種瀏覽網絡的全新方式。
www.stumbleupon.com - 2013-11-29 - 收藏必應搜索
Bing.com是一款微軟公司推出的用以取代Live Search的搜索引擎。微軟CEO史蒂夫?鮑爾默(Steve Ballmer)于2009年5月28日在《華爾街日報》于圣迭戈(San Diego)舉辦的“All Things D”公布,簡體中文版必應已于2009年6月1日正式對外開放訪問。微軟方面聲稱,此款搜索引擎將以全新姿態面世,將帶來新革命。內測代號為Kumo,其后才被命名為Bing。中文名稱被定為“必應”,有“有求必應”的寓意。Bing另有中國面餅、Bing飲料之意。
為了確保新版搜索引擎Bing成為全球化品牌,微軟已經申請了能想到的幾乎所有國家的地理域名。 微軟首席執行官史蒂夫-鮑爾默(Steve Ballmer)將在《華爾街日報》舉辦的“All Things D”大會上揭開Bing的神秘面紗。為了確保新的名稱能夠得到廣泛認可,微軟將斥資8000萬至1億美元在全美范圍內的電視、廣播、報紙、互聯網和戶外媒體投放廣告。其創意代理商為WPP旗下的JWT(智威湯遜)。至于美國之外的地區是否會投放規模較小的廣告,目前尚不清楚。《廣告時代》雜志稱,微軟這一支出超過大部分消費產品發布時的廣告支出。谷歌2008年全年的廣告支出也不過2500萬美元。另外,微軟的廣告中也不會提及谷歌,而且還會將Bing作為一款全新的具有革命意義的產品來推廣。
繼新一代搜索引擎Bing全球上線之后,微軟推出了Bing的移動版本,手機和其他移動設備用戶可登錄bing.com享受移動搜索服務。手機版本的Bing搜索引擎可對搜索結果進行優化排版,方便用戶閱讀搜索結果,當用戶點擊任何一個搜索結果,例如打開一個網頁時,Bing會將其自動劃分為幾個區域,用戶只需點擊數字區域即可觀看該部分內容。根據Bing文檔,微軟在不久的將來還會提供可下載的移動Bing客戶端版本。
www.bing.com - 2013-11-29 - 收藏PubMed
PubMed.cn是醫學,生命科學領域的數據庫,旨在組織、分享科研領域信息。為用戶提供文獻檢索,圖片檢索,影響因子查詢,免費全文下載,國家自然科學基金統計分析等服務。
www.pubmed.cn - 2013-11-29 - 收藏
???? 這是一個長期的項目,我們將在接下來的開發中,不斷進行創新的探索,并保持與用戶的互動,在互動中不斷完善這個新產品。
關于數據授權
???? PubMed.CN項目申請了NIH的MedLine數據庫的基礎數據使用權限,并嚴格按照授權協議說明使用這部分數據。同時,我們的項目中也已經和即將加入大量MedLine數據庫以外的數據,并對這類數據進行分析和整合。
關于域名
???? PubMed.CN是由丁香園網站擁有的獨立域名(感謝周韶璋教授轉讓域名給丁香園),采用此域名是為了便于用戶記憶。
關于用戶反饋
???? 使用此產品的用戶如有任何建議和反饋,請到此帖跟貼反饋,我們非常高興大家和我們互動來改進這個產品。
關于其他
???? 除已經獲得授權的數據以外,PubMed.CN網站本身不生產和上傳任何數據,任何文獻、圖片、評論及相關數據均由用戶提供,該項目由于與丁香園使用同一套會員系統,使用此網站的協議將與丁香園網站的注冊用戶使用協議相同。對于在搜索、文獻傳遞和用戶交流過程中不得以商業性用途為目的之主張,我們特此強調。Musikki
Musikki.com是在葡萄牙上線的一個新的音樂搜索引擎,為用戶聚集關于歌曲、歌手的完全信息。音樂搜索引擎算是互聯網的一項基本、必備服務。發展到現在,人們要想在網上找到一首歌曲、下載等已經非常方便,要了解音樂的基本信息也有多種工具。你可以通過谷歌、維基百科、百度MP3、豆瓣等很方便地獲取音樂信息。但是對于資深的、熱愛音樂的粉絲們而言,目前現有音樂搜索引擎都無法完全滿足他們的需求,他們希望用最簡單的方式、獲取盡可能多的音樂信息,這就是Musikki.com作為后來者所希望做到的。
Musikki.com作為新的音樂搜索引擎,我們將其理解為Google+豆瓣音樂信息,通過關鍵詞,Musikki.com會為用戶呈現最完全的音樂信息,包括音樂的試聽地址、亞馬遜的購買鏈接、關于該歌手的信息、同類或相關歌曲推薦、相關圖片或演唱會視頻以及Twitter信息等。
在Musikki.com網站上,其希望將所有與其直接相關的信息整合到一起,無論是歌曲還是歌手,而不會提供無用或不相關的信息,而且目前Musikki.com也沒有相關廣告,讓整個搜索頁面看上去簡潔、一目了然,有很好的使用體驗。不知道今后Musikki.com會不會因為各種原因加上廣告、Web2.0元素等,這樣變復雜后的Musikki網站或許和其他網站也就沒撒兩樣了,但目前看來其還是很OK的。當然,在現在人們搜索音樂有很成熟的習慣及做法的時候,要再進軍這個領域已經比較困難的,所以Musikki.com網站可能很難吸引比較多的用戶,不過如果大家一旦知道并喜歡上的話,Musikki.com網站的忠實度會高很多。
聯系方式:如果你有任何問題,可以在http://www.musikki.com/form/contact頁面填寫并提交相關內容。
www.musikki.com - 2013-11-29 - 收藏Google 圖書
搜索圖書全文,查找您感興趣的圖書,并了解何處可選購或借閱它們。
只需在 Google 圖書搜索或 Google.com 上進行搜索即可。當我們發現一本書包含與您的搜索字詞匹配的內容時,我們就會在您的搜索結果中顯示此書。點擊書名,您會看到摘錄視圖。該視圖與卡片目錄類似,會顯示圖書的相關信息,外加幾小段內容 – 即與您的搜索字詞相關的幾個句子。如果出版商或作者已給予我們授權,您可能還會看到示例網頁視圖;或者,如果圖書已不受版權保護,您可能會看到全書視圖。所有情況下,您都會看到與在線書店直接鏈接的“購買此書”鏈接,您可以從那里購買圖書。
Google 圖書搜索中的圖書內容有兩個來源:出版商和圖書館。
google用戶可以把搜索的的圖書分類保存起來,可以隨時隨地的查閱(當然是指能正常的連接google服務器的情況下)。
另外google對那些不受版權保護的圖書,向用戶開放了PDF下載功能,這是很有用的,也很實用。
books.google.com - 2013-11-29 - 收藏google code
Google 代碼搜索為您提供了一個搜索互聯網上可公開訪問的源代碼的場所,從而幫助您找到功能定義和代碼示例。利用 Google 代碼搜索,您可以:?
1、使用正則表達式進行更為精確的搜索
2、按語言、許可或文件名限制搜索
3、查看源文件(包含指向其所在的整個包及網頁的鏈接)
Google代碼(Google Code)是Google公司利用自身服務器資源提供的開發人員主頁。其最初目的是為Google自身的開源軟件提供開發平臺,以及協助開發者擴展Google產品的功能。隨著Google開源之夏等項目的推進,Google代碼正在成為一個開放的項目托管平臺,類似Sourceforge提供版本控制、問題跟蹤、Wiki、下載托管等工具。截至2009年3月,已有超過50,000個項目以Google Code為家。
在中國大陸,Google代碼大部分內容一般能正常訪問。
?
code.google.com - 2013-11-29 - 收藏
推薦資訊
推薦站點
頭像寶
頭像寶免費為網友提供大量豐富、精美的QQ頭像、女生頭像、男生頭像、情侶頭像、非主流頭像、動漫頭像等,好看的頭像大全盡在頭像寶網站。
www.vstou.com鞭牛士
鞭牛士 - 專注報道互聯網 BiaNews 欲知網編事,必上Bianews。我們是中國第一網絡編輯交流社區。為網絡編輯提供就業、實習、交流、分享平臺。門戶主編坐鎮,解答網絡編輯疑問,近20000名網絡編輯幫助您成為最優秀的網絡編輯員和網絡編輯師,同時,我們還為中國互聯網公司招聘網絡編輯,信息真實,圈子招聘成功率極高。北京網絡編輯培訓機構獨家發布網絡編輯的認證與培訓信息、網絡編輯的行業動態以及網絡編輯的職業能力測試等信息。
www.bianews.com新書城
新書城網上書店,上海地區專業的網上書店,主要經營計算機、經管會計、英語考研等圖書,上海地區提供送貨上門服務。
www.newbooks.com.cn中國教育裝備采購網
中國教育裝備采購網是教育裝備行業網站,提供教育裝備行業儀器儀表,分析儀器,標本模型,校用家具,機電設備超過1000000條產品信息與70000條廠商信息,每天更新500條以上行業招標與求購信息。
www.caigou.com.cn亞馬遜
亞馬遜中國(z.cn)是全球領先的電子商務公司亞馬遜在中國的網站。秉承“以客戶為中心”的理念,亞馬遜中國承諾“天天低價,正品行貨”,致力于從低價、選品、便利三個方面為消費者打造一個百分百可信賴的網上購物環境。作為一家在中國處于領先地位的電商,亞馬遜中國為消費者提供圖書、音樂、影視、手機數碼、家電、家居、玩具、健康、美容化妝、鐘表首飾、服飾箱包、鞋靴、 運動、食品、母嬰、戶外和休閑等29大類、上千萬種的產品,通過“貨到付款”等多種支付方式,為中國消費者提供便利、快捷的網購體驗。
www.amazon.cn
