關於微軟學術搜索


(由於沒讓說優點,所以下面的內容只有對缺點的描述,說的有點狠。。)

第一部分:微軟學術搜索網站的功能性問題

根據老師在博客上的要求,我在閱讀了相關的微軟學術搜索項目的相關功能之后,親自測試了大多數的搜索功能(其實在之前做團隊項目Ui的時候就已經接觸過了,不過當時主要集中在界面元素的設計方面,而這次測試的重點在於其搜索功能),其中包括:

(1)    簡單搜索(僅搜索關鍵詞)

(2)    學科方面專業搜索(使用All Domains的面板來選擇要搜索關鍵詞的學科范圍,不過要實現這個目的可以先使用簡單搜索,然后在搜索結果頁面的左邊也可以再次選取想要的學科方面,而且此時還可以看到關鍵詞在每個領域的結果數量)

(3)    高級搜索功能(Advanced Search功能,我們在設計XueBa網站的時候采用的也是這樣的功能設計方案,即根據搜索內容的類型提供給用戶相應的具體信息的限制)

(4)    測試了微軟學術搜索中的信息可以由使用者自己修改的功能(首先要登錄LiveID)

(5)    征稿信息查詢的功能,個人感覺這個做的很不錯!

(6)    作者或者學科家族關系圖(這個功能還是很有用的,畢竟圖形化的信息能夠更好更快地被人接受,但是我在測試Embed功能,也就是把圖片嵌入自己在其它網站的博客頁面里的時候出現了一點小問題,不知道能不能算是functional bug,在后面細講)

(7)    查看內容的引用信息(這個其實重要的還是給人一個大致上的概念而已,因為當搜索比較的內容很多的時候,圖就會顯得不是很細致,這樣分析數據肯定是不行的,而引用信息的查看其實也用不到數據,僅僅是趨勢上的認識就可以了)

(8)    學術地圖與機構比較(不得不說這個表現手法確實很高端,我搜了很多國內外的研究機構,給出來的信息還是相當全面的)

有關關系圖Embed的問題:經自己的不完整測試,嵌入的內容在cnblogs的博文里是可以成功瀏覽的,但是在其它有些網站的博文會出現頭像顯示不出來或者鏈接失敗的那種小叉的情況,例如網易和百度的(后來發現好像當把論文列表嵌入的時候也有同樣的問題,而且列表要用javascript嵌入,不知道是因為有些網站自己的問題還是生成的javascipt有問題呢?但是cnblogs里都沒有問題,個人感覺這個貌似不能算是個functional bug吧)

還有一個應該算是功能上的問題,這個問題同樣出現在了我們在做XueBa的時候,考慮到使用者最方便地使用搜索功能,所以在網站的任何地方都應該設置搜索功能的使用元素,而學術搜索在很多很內層的頁面里也是沒有這個的,這就也許會造成當用戶在搜索的過程中想改變搜索內容時不得不退回到剛才的搜索結果頁面(最多是這個頁面吧)才能繼續,這樣至少在我使用起來是很不方便的,而且要改進這個問題應該非常容易吧(我在改XueBa界面的時候就很容易~)

第二部分:

我之前找論文很多都是使用谷歌的學術搜索(http://scholar.google.com)。近幾天,通過使用微軟學術搜索,我發現了很多它們之間的不同。在通過閱讀微軟學術搜索的10個版本迭代(http://www.cnblogs.com/xinz/archive/2012/02/20/2358888.html)后,我似乎找到了一些原因。

首先,該文章並沒有花很大的篇幅介紹其需求分析階段,而我覺得這正是微軟學術搜索最缺少的。

在V2的開始階段,博客中展現了微軟學術搜索需要考慮的三類典型用戶。而最終得出的結論是——不比拼論文下載,沒了。

這最終決定了我在它和谷歌學術搜索的比拼中,選擇了后者。

這三類典型用戶其實最需要的是啥?以下是我的猜測:

Mary:他其實已經對他所在了領域十分了解。他需要做的是把握他所在的領域的最新進展,這需要搜索引擎的更新速度非常快,范圍非常廣。另外,比較各個學校/機構的科研產出和動向也比較重要,但這似乎不應該是學術搜索引擎的主業。

John:他其實結合了Mary和小勇的部分特點。

小勇:正如我或者我的學長們一樣。他們首先需要的是找到自己的領域,並做深入的調研。這需要搜索引擎可以更好的——找到最符合搜索關鍵詞的論文(排序要好),然后論文要多(這樣才會深入);然后,他們需要學習相關論文的要點,這需要搜索引擎——具備下載功能:下載不是一個需要比拼的功能,而是一個必需的功能。

綜上所述,一個好的學術搜索引擎最需要什么?大量的數據、優質的排序、符合用戶需要的統計、下載。其中最重要的是什么?大量的數據。

而這些,微軟學術搜索只占了一點——統計,各種統計表,也就是博客里面說到的“聯系”,確實能夠對學校、作者、領域有一個全方位的認識。但是,有了認識,我希望深入了解的時候,我還是會選擇谷歌。

所以說,微軟學術搜索的十個階段,出問題的恰恰在一開始的需求分析,於是它在錯誤的道路上越走越遠。。。

比如說,我以我上個暑假一直在搞的一個關於VLC(Visual Light Communication)的研究為例。

我首先發現了一篇描述Cobra的文章,它和我的研究領域非常相似。於是我分別在微軟學術搜索和谷歌學術搜索上搜索“Cobra”。唰,結果出來了:

顯然,叫Cobra的太多了。但是顯然,谷歌的結果比微軟的多。Cobra和VLC有關,於是我把關鍵詞加上了VLC:

 

我還希望試一試微軟學術搜索邊欄上的分類功能呢,這下沒必要了。。這也太少了吧,只有一條搜索結果。而谷歌不僅告訴我了那篇文章,還告訴我了那篇文章的Demo,還告訴我了引用了那篇文章的文章。。還告訴我了下載地址

算了不追究這個了,通過通讀Cobra,我發現Cobra一篇似乎不夠,我需要的是它引用的和引用它的所有文章(尤其是后者)。可惜的是,微軟學術似乎都不支持查看一篇論文的引用,除非進入其他的網站或者將它下載下來(微軟學術搜索似乎有引用鏈的功能?為什么我找不到?),而谷歌可以通過“相關文章”找到它們。另外,我希望看到引用它的所有文章。可惜的是,微軟也不提供這個功能(或者提供了,我沒找到?),而谷歌在明顯的位置告訴我“被引用次數:1”。

我通過谷歌獲得了那篇引用了Cobra的文章,它的名字叫做“Smooth Transmission over Unsychronized VLC Links”,這是一篇比較新的paper。我通過微軟搜索這篇文章,結果是:

沒有。

這意味着什么?意味着假如我不幸想到的是和那篇文章一樣的內容,我很高興(沒有人發現這個問題!我可以發表論文了哦也),於是辛苦寫出了一篇文章投了出去,可是百投百敗,卻不知道為啥(我寫的沒問題呀)。終於等到白了少年頭用了回谷歌,才終於發現——原來是微軟毀了我的一生。。

好了,有點跑題。說回來,沒有大量的數據,搜索的可靠性就會降低。當然,也可能與我搜索的論文都比較新有關。但是,微軟學術搜索在一開始的需求分析時就沒有將內容和質量放在第一位,卻把重心投入到了花拳綉腿的聯系上,直接導致了它先天功能不全,難以與谷歌搜索抗衡。而那些花拳綉腿,在沒有大量的數據支撐的時候,准確性也值得商榷。我認為,應該加強微軟學術搜索的數據庫,至少加到和谷歌學術搜索在一個數量級。

另外允許我吐一下嘈,微軟近些年一直在犯類似的問題——一直沒有將需求分析放在第一位,不去考慮用戶到底真正需要什么,卻總在費盡心思的找差異性。比如WP7、WP8(至今沒有控制重力感應的功能,至今沒有草稿箱功能,至今沒有音量分開控制功能)、Win8(RT與Windows合在一起不知道是誰想到的餿主意),希望鄒老師能夠向上級反映。

第三部分:

采訪對象:同屆計算機學院同學 岳喜春

相片如下:

用戶的問題解決了么?不全是

軟件的優點:

界面美觀,直觀,大方,圖例清晰。

軟件的缺點:

英文版看不懂,搜索不到中文論文,沒有引用信息。

改進意見:改掉上述缺點。

第四部分:搜索網站在移動設備上的應用

(1)    目前市場上有什么樣的產品了?基於各大網絡搜索引擎,很多搜索網站都多多少少地做了一些自己產品在移動設備上的應用,介於個人使用的移動設備的關系,在此僅以iOS系統的移動設備應用舉例吧,例如百度,谷歌(雖然谷歌學術還沒有獨立的搜索應用)等都有自己的移動應用,而且現在看比較火的Win8平板應用更是數不勝數;

(2)    設計什么樣的功能?為什么會使用你的應用?由於是搜索功能的應用,功能自然是基於搜索的,然后其它的輔助功能例如:圖形搜索,可以分析曲線圖和餅狀圖之類的功能,還有基於多個領域的搜索,收集詞條和搜索結果(搜索歷史),關注的動態信息,這樣用戶不僅可以用這個應用來實時搜索,還可以記錄下來曾經搜索內容的離線信息,方便以后查看和提醒等等;

(3)    如果你的團隊有五個人,三個月的時間,你作為項目經理,應該如何配置角色?例如開發,測試,美工等等?首先介於我在團隊項目里的任務就是完成美工,個人覺得美工還是有特定的一個人來完成比較好,風格統一,然后最后的測試程序要分不同的部分由不同的負責人測試各自的部分,最后在匯總測試,所以測試部分不需要非常明確的某個人來完成,在開發方面,需要一個人負責數據庫部分,其它的可以根據軟件內部不同部分來具體分工;


注意!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系我们删除。



 
粤ICP备14056181号  © 2014-2021 ITdaan.com