2016年12月16日 星期五

讓 MongoDB 也能處理中文的方法

https://www.facebook.com/ccckmit/posts/10154670232536893 by 金門大學 陳鍾誠教授

MongoDB 只支援《英文和數字的全文檢索》,但是不能正確進行《中文全文檢索》。
於是我將所有非英文 unicode 字元通通轉成其 unicode 16進位數字碼,放入 keywords 欄位中,這樣就可以先將查詢的中文轉成數字碼後,再進行檢索 ...
這種方法讓 mongoDB 也能支援《中文的全文檢索》了!
===========================================
範例:
文章:.... 我是陳鍾誠 .... => ... 6211 662f 9673 937e 8aa0 ...
檢索:包含《誠》字的文章 => mdTable.find({"$text":{"$search":"8aa0"}}).toArray();

沒有留言: