<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    關于信息系統組織方式的一個提案

    關于信息系統組織方式的一個提案

    序言

    昨日整理Gmail信箱之時,覺有不便之處,于是進入“Suggest a feature for Gmail”的頁面,準備提些建議。不意一只靈感的小蟲悄悄爬上腦梢,急欲捕之而后快。遂作“A Proposal on Organization of Information System”一文,以備Gmail參考之用。甘冒不謙之嫌,竊以為該提案是對包括文件系統、郵件系統等在內的信息系統的組織方式的一種創新。為讓更多的國內同仁了解,現將此文譯成中文。倉促成文,還望諸位方家不吝賜教。

    鄭暉于2008519

    1. 引言

    我們生活在一個信息時代,但有時信息帶來的負擔甚至超過收益。從用戶的角度看,大多數信息系統包括文件系統、郵件系統和各類基于菜單的系統本質上都是層級(hierarchical)結構的。隨著信息量的遞增,系統的可用性卻在遞減。這種結構的主要缺陷是它僅提供了通往目標信息的單一通道。用戶在任何一個轉角處走錯都可能導致最終迷路。如果一個信息系統能支持多路通道,情況就會得到改善。有鑒于此,本文借助Gmail系統的一些思想提出了一個切實可行的方案。

    2.信息檢索之困

    信息是個好東西,可儲存和重新獲取卻令人頭痛。日復一日地,一個典型的計算機用戶瀏覽并保存網頁,收集心儀的書簽和RSS,從BTemule上下載文件,收發電子郵件,編寫文檔或程序。他愉悅地享受著這一切,直到有一天他發現自己逐漸為信息超載所困擾。一個明顯的跡象是他時不時感到有點頭暈——他的桌面凌亂不堪,各種圖標如沙丁魚般“濟濟一堂”;他的書簽菜單展開來如巨毯般一直拖到地上;他的信箱塞滿郵件,鼓鼓囊囊、幾欲暴裂。他開始意識到如果這種狀況不改變,他的腦袋一定比硬盤或郵箱更早爆炸。此后,他養成了將文件、書簽和郵件整理到層級文件夾中的習慣。情況果然大為改觀。惜乎好景不長,文檔數量增長迅猛,文件夾越來越多、越來越深。將一個文檔保存到合適的地方需要花費時間,而找回當初下載或創建的文檔則更花時間。整日在樹狀結構中穿梭,他有些倦惱和迷失了。他知道自己擁有一棵遮天蔽日的圣誕樹,上面掛滿了琳瑯滿目的禮物,可是沒有多少是觸手可及的。每每在掘地三尺仍一無所獲之后,他不得不懷疑自己的記憶,偶爾也忍不住懷疑機器的記憶。明知那些失蹤之物從來不會自動跳出來,他還是情不自禁地沖著電腦歇斯底里:那些該死的文檔到底躲到哪里去了?時不時地,他又滑回老習慣:將所有最新的文件保存到桌面,不為別的,只是那里似乎更方便更令人放心。我們不禁要問:這種困境的根源是什么?

    3. Gmail解決方案

    問題出在傳統的信息組織方式上,即樹(或森林)型結構。這種層級結構應付大量信息尚勝任有余,但對于海量信息則有些不堪重負。隨著信息量的膨脹,樹型結構越來越力不從心。許多文件夾中的列表不可避免地變長,一些文件夾被深層嵌套。在文件系統中,通過在Windows中創建捷徑或在Unix類的操作系統中創建符號鏈接(symbolic link)能一定程度上緩解一些癥狀,但顯然不能根治。作為一種有趣的替代方案,GoogleGmail提供了他們稱作“標簽”(label)的工具。一個標簽是一種文字標記,它能與其他的標簽同時應用到一條信息上。開始許多用戶抱怨它,因為他們習慣了文件夾風格。但這種抱怨慢慢減少,用戶發現他們的信息不再是藏于密密叢林的游擊隊,而是一字排開等待檢閱的正規軍。所有最近的信息都在頂部,而這在精心組織的文件夾系統中是不可能的。用戶不再為如何分類信息而犯難,他們可以在每條信息上貼上任意多的標簽。找一個特定的信息也很容易,既可用自定義標簽來過濾,也可用系統標簽如inbox, sent, star, chat, trash等來過濾。他們還能通過收信人、發信人、主題和信息內容來搜索。更好的是,用戶可定義過濾器自動為來信貼標簽。這種解決方案,今后我們稱為標簽結構,不必囿于郵件管理系統,它能有效地用于文件系統和其他諸如知識管理系統之類的信息系統。

    4. 改進方案

    標簽結構并非盡善盡美。盡管與信息數量比,標簽要少得多,但依然會泛濫。在Gmail的標簽結構中,所有用戶定義的標簽是獨立而平等的,但事實上——不同的標簽在重要性、緊急性和常用性上可能大相徑庭;一些標簽有著內在聯系;同一信息上的不同標簽在相關度上也有所不同。比如,“工作”或“家庭”的標簽更重要,“待做”或“考試”的標簽更緊急,“體育”或“電影”的標簽對一個體育迷或電影迷來說更常用。當一個程序員將一些資料標記為“Java”或“C++”后,他很希望它們能自動加上“程序語言”和“OOP”的標簽,以便今后它們能出現在一個列表中。最后,一些標簽可能比另外的標簽更能描述一條信息。綜合以上考慮,我們提出如下可行方案。

    • 在標簽結構中引入層級結構。我們將標簽視作信息的元數據,并將它們以傳統的樹型結構來組織。這樣我們將兩個世界最好的部分結合起來,取長補短。實際上我們可以走得更遠。我們知道,層級樹型結構在圖論中是有向樹,只要有意義,我們可以把標簽結構推廣為有向圖digraph)。這意味著一個標簽可以有多個上級,有點類似一些OOP語言中的多繼承。顯然當所有的標簽都是樹根(即無子標簽)時,就退化為Gmail的標簽結構
    • 為標簽引入重要性、緊急性和常用性權重,標簽可按權重排序。Gmail的星號標簽可作此用,但粒度過粗。常用性權重可在每次訪問后自動增值,這樣最常用的標簽總在前面。標簽還能按最近訪問時間來排序。如是,用戶最關心的信息抬眼即是、垂手可得。
    • 引入主標簽。一項信息的某個標簽可設為主標簽。從這種意義上講,傳統的樹型結構是我們這種結構的特例:每個文件夾名正是一個標簽名。(但有一個細微差別:同樣的文件夾名在不同的路徑下不會象標簽名那樣發生沖突)如果主標簽的相關度是1,那么其他標簽的相關度應在01之間,這為搜索和排序提供了新的準則。
    • 引入別名標簽。標簽允許有多個名字,這些名字可以是同義詞、縮寫甚至是不同的語種。別名還能更強大:用戶可一個標簽定義為其他標簽的邏輯組合。例如,“我的程序”可定義為“我的文檔and程序”,“娛樂”可定義為“體育or小說or電影”等等。
    • 引入線信(thread)。用戶能建立thread將相關信息連接起來。Gmail中有會話(conversation),但用戶無法自己合并相關郵件。thread 對信息跟蹤和保留不同版本的信息非常有用,這種聚合使得信息系統更加緊湊連貫。

    5. 結論

    要定位一項信息,用戶在層級系統中需要點擊文件夾在展開,在標簽系統中需要點擊標簽來過濾。我們沒有提及搜索是因為搜索較慢且有些信息不以文本形式存在。標簽系統是更好的解決方案,但仍有不足之處。為了進一步方便信息檢索,我們設計了含權有向圖標簽結構weighted diagraph tag structure),這是一種結合樹型結構的優點的標簽結構。一個具此結構的信息系統應該更加平易近人且令人愉快,它的用戶可以象悠閑的養魚人,不管往池塘里投入多少條魚,只要一聲口哨,他想要的那條就會搖頭擺尾地游過來。

    posted on 2008-05-20 00:00 鄭暉 閱讀(3114) 評論(13)  編輯  收藏 所屬分類: idea

    評論

    # re: 關于信息系統組織方式的一個提案 2008-05-20 02:04 plusy

    首先感謝你分享你的想法。

    這里我想補充一些我個人對gmail標簽系統的理解。
    gmail的標簽系統,個人感覺像一個列表(List),如果不考慮thread和時間排序的因素,更像一個字典,標簽是key,而郵件是values. 如果引入權重,則更像隊列(Queue), 如果引入樹狀層級,則相當于重新構建了一個文件系統結構,如果引入圖結構,則可以構成復雜連接。從思維的角度來說,標簽是給原始的信息標上了索引,即加上了語義,標簽鏈接關系是另一層的語義。權重、父子和多維關聯是隊列、樹和圖所表達的基本語義。這里的關鍵是要讓語義來組織信息。
    訪問頻率作為權重、“主標簽”作為“相關度”和線信作為聚合引擎,這三種方法都是基于對用戶行為的跟蹤得來的,可以自動執行,例如gmail的filter。但標簽之間的有向關聯,別名和文件夾命名則需要用戶的干預,機器無法精確理解。比較好的可能是集成人工干預,例如標簽的導航系統,內容分析系統,甚至搜索系統,這些都需持續的行為觀察和記憶。以上是我對樓主proposal從語義和語法角度的理解。

    另外,如果單純使用語法層面的標簽系統,對郵件系統而言,可能有一些困難,以下是我自己遇到的一些問題,供你在設計的時候參考:
    (1)標簽可能會出現錯別字,會導致基于文本比較的關聯失敗。例如會出現多個別名,”經管“,”盡管“等其實都是想表達“經濟與管理”,但用戶的疏忽會導致需要一個容錯機制,或一個異常的解決方式
    (2)維護大量的標簽所帶來的麻煩是否會抵消它所帶來的好處。我們使用文件系統屏蔽了直接維護inode的不便,現在我們用標簽來屏蔽文件樹的不便。標簽所帶來的扁平化的好處,可能會圖、樹的復雜性所消耗,從而帶來新的維護負擔。例如我自己在gmail中使用了有前綴的標簽(使用字母順表達優先級,共同前綴表達樹狀關聯),但如果標簽太多,標簽列表就會太長而沒辦法在一屏顯示。
    (3)別名機制的沖突問題。這個你在proposal中已經提到了,如果關注度是通過文本方式(搜索和排序)來提取的,則可能會導致自遞歸循環,實現上比較麻煩。我猜想gmail的filter中無法使用另一個filter大概是為了避免這個問題。

    不管我的理解是否貼切,以及幾個特例是否有價值,都希望能早日用到你所設想的標簽系統。

    最后感謝你的proposal再次激發了我自己對gmail標簽系統的思考。  回復  更多評論   

    # re: 關于信息系統組織方式的一個提案 2008-05-20 08:51 HiMagic!

    plusy說的不錯,標tag就是分類、語義化的過程,究其本質,我覺得和收藏夾的層級結構差不多,尤其是對于有層級關系的tag。tag的先進之處在于其便捷,便捷也可以理解為隨意,隨意過頭了也會失控,無法管理。所以,這么多方法、工具擺在這了,如何善用還要看使用者是否用心去管理了。  回復  更多評論   

    # re: 關于信息系統組織方式的一個提案 2008-05-20 09:19 鄭暉

    @plusy
    由于篇幅過長,我將專門發貼回復您的評論。  回復  更多評論   

    # re: 關于信息系統組織方式的一個提案 2008-05-20 09:37 鄭暉

    @HiMagic!
    如果用戶的文件或郵件超過萬個(這一點也不奇怪),即使他再用心管理,依現有的方法和工具來看,即使夠用,也不好用。  回復  更多評論   

    # re: 關于信息系統組織方式的一個提案 2008-05-20 19:19 popoer

    博主用過del.icio.us沒有?他的tag功能是很強大的  回復  更多評論   

    # re: 關于信息系統組織方式的一個提案 2008-05-20 20:42 鄭暉

    @popoer
    我有del.icio.us的帳戶。如果將其tag用于管理大型信息系統,要改進的地方還有很多。比如,它的tag可以bundle,只是我提出的標簽結構的一種特例;tag對邏輯組合查詢的支持也不夠;它的tag可以按freq和alpha排序,但不能按重要性和緊急性排序;它也沒有thread的功能,也沒有相關度的概念。畢竟該系統只是管理bookmark的,而非更廣義的信息。  回復  更多評論   

    # re: 關于信息系統組織方式的一個提案 2008-05-21 16:54 Xw.Y

    很贊,我想知道哪里可以找到您指的"含權有向圖標簽結構",謝謝。  回復  更多評論   

    # re: 關于信息系統組織方式的一個提案 2008-05-21 17:38 鄭暉

    @Xw.Y
    含權有向圖標簽結構是本文第一次提出來的概念,文中已有說明。只次一家,別無分店。  回復  更多評論   

    # re: 關于信息系統組織方式的一個提案 2008-05-23 15:50 Xw.Y

    @鄭暉
    謝謝作者的解釋。
    原來此文就是用來解釋“”的呀
    愚鈍愚鈍。。。
    我想這個問題歸結到底,
    就是在 靈活性/擴展性/復雜度 vs 易用性 之間取得平衡。
    gmail僅是一個平鋪的tag方式。
    delicio是一個帶boudle的平鋪tag
    不知道作者有沒有看過google reader,
    它將label/tag 和 folder混用了
    實際的使用體驗也不錯。
    freq,alpha排序,也無非就是多一些能夠排序的方式,這個可以繼續擴展。

    很向往“悠閑的養魚人,不管往池塘里投入多少條魚,只要一聲口哨,他想要的那條就會搖頭擺尾地游過來”這樣的系統,
    希望能夠用上。。。
    不過懷疑真有這種系統的話,
    也許需要一些人工智能的輔助了。。。好復雜。。。  回復  更多評論   

    # re: 關于信息系統組織方式的一個提案 2008-07-19 01:13 plusy

    這個帖子有一小部分討論Label(Tag)的段落
    http://lifehacker.com/398778/outlook-vs-gmail++the-definitive-comparision

    On the surface, labels seem superior to a folder tree—after all, tags are the preferred method of identifying data on many new web sites. There are a few problems with labels, though:

    * There's no such thing as "sub-labels." As such, if you decide to use Google like a folder tree, you'll quickly discover that the hierarchy is only one-level.
    * There is no drag and drop functionality in the Gmail web interface (most likely since applying a label isn't necessarily moving it from one label to another).
    * Gmail's labels are not 100% compatible with IMAP support. They're mostly compatible, but some people (like me) may run into synchronization issues.

    Even with these slight limitations, Google was wise to eschew the top-down methodology to which many of us have grown accustomed. Since Gmail's search is very fast, the need for finding items by how they've been filed becomes less important.

      回復  更多評論   

    # re: 關于信息系統組織方式的一個提案 2008-07-19 08:38 鄭暉

    @plusy
    此文也認為沒有sub-labels是gmail的一個問題。

    難得你保持對該問題的關注,多謝分享!  回復  更多評論   

    # 又收到一些tag與分類相關的討論 2008-07-31 08:38 Plusy

    我是Plusy.
    請博主給個郵件什么的,我有幾個資料鏈關于tag和分類的,
    被你的 Spammer Checker給據了。

    我的郵件 gmgcan@gmail.com
      回復  更多評論   

    # re: 關于信息系統組織方式的一個提案 2008-07-31 09:49 鄭暉

    @Plusy
    我剛通過gmail給你回復了。非常感謝!  回復  更多評論   

    導航

    統計

    公告

    博客搬家:http://blog.zhenghui.org
    《冒號課堂》一書于2009年10月上市,詳情請見
    冒號課堂

    留言簿(17)

    隨筆分類(61)

    隨筆檔案(61)

    文章分類(1)

    文章檔案(1)

    最新隨筆

    積分與排名

    最新評論

    閱讀排行榜

    評論排行榜

    主站蜘蛛池模板: 日韩电影免费在线观看视频| 午夜福利不卡片在线播放免费| 国产成人免费a在线资源| 亚洲av片不卡无码久久| 13一14周岁毛片免费| 久久久国产精品亚洲一区| 国产精品免费大片| 亚洲人成网www| h视频在线免费看| 国产.亚洲.欧洲在线| 女人18毛片特级一级免费视频 | 中文日本免费高清| 国产亚洲美女精品久久久久狼| 国产又黄又爽胸又大免费视频| 亚洲精品乱码久久久久久自慰| 免费国产99久久久香蕉| 久久精品国产亚洲av麻豆小说| av免费不卡国产观看| 亚洲欧美日韩中文字幕在线一区| 国产成人精品免费视频大全五级 | 亚洲伦理中文字幕| 免费观看大片毛片| 国产免费人成视频在线播放播| 国产亚洲一区二区手机在线观看| 免费国产黄网站在线观看视频| 亚洲国产精品成人精品软件| 女人18毛片水真多免费播放| 边摸边脱吃奶边高潮视频免费| 亚洲精品高清国产一线久久| 19禁啪啪无遮挡免费网站| 亚洲欧美日韩中文高清www777| 亚洲福利精品一区二区三区| 国产三级在线免费| 亚洲色偷偷综合亚洲AV伊人蜜桃 | 亚洲精品天堂在线观看| 亚洲高清偷拍一区二区三区| 日韩在线不卡免费视频一区| 最新国产成人亚洲精品影院| 久久国产成人亚洲精品影院| 在线观看www日本免费网站| 午夜在线免费视频 |