<ruby id="45d9r"></ruby>

<tbody id="45d9r"></tbody>

  1. <tbody id="45d9r"></tbody>

    淘豆網
    1/5
    文檔分類:辦公文檔 > 辦公軟件應用

    基于泛中文域名的網頁關鍵詞超鏈接實現與應用.doc


    下載后只包含 1 個 DOC 格式的文檔,沒有任何的圖紙或源代碼,查看文件列表

    特別說明:文檔預覽什么樣,下載就是什么樣。

    0/100
    您的瀏覽器不支持進度條
    更多>>該用戶其他文檔
    下載所得到的文件列表
    基于泛中文域名的網頁關鍵詞超鏈接實現與應用.doc
    文檔介紹:
    基于泛中文域名的網頁關鍵詞超鏈接功能探討與實現 Introduction and Implementation of WebPage Content K eyword HyperLinks Based on W ildcard D omain N ame 杜義華( 中國科學院計算機網絡信息中心管理信息服務中心 100864) 摘要: 本文介紹一種基于泛中文域名的關鍵詞超鏈接實現方法。主要是通過構建完整的關鍵詞表、利用泛域名解析與虛擬中文域名的重定向技術和簡單實用的添加鏈接算法, 實現網頁全文中所有專業術語、通用詞均能點擊和按關鍵詞+ 域名方式直接訪問到相應站點、專題、網頁或搜索頁的充分互聯, 解決網頁中關鍵詞鏈接不全面、導向地址不準確、不便記憶或無法及時更新、鏈接方式不理想等技術問題。關鍵詞:泛域名中文虛擬域名關鍵詞超鏈接 1前言超鏈接是互聯網的重要特點,在頻道欄目、標簽(tags) 、相關文章或熱點推薦等線性結構導航與檢索基礎上, 網頁全文的關鍵詞超鏈接能讓各知識點多維網狀互聯, 門戶、行業或專門網站中全面完整的關鍵詞鏈接標識有助于將信息立體式展示和為用戶提供快捷的百科全書式閱讀功能[1]。網站中知識點和所涉及關鍵詞可能很多, 但由于信息整理量大、信息組織不能一步到位、一些關鍵詞的導向頁面不確定、超鏈接添加算法不完備等, 目前只有少數網站的部分網頁進行有部分關鍵詞鏈接,如 http://news./c/2006-03-24/22048522691s.shtml 中部分詞匯鏈至相關話題、人物專欄或搜索頁( ?k= ), 且鏈接點不全面、鏈接地址不便調整,尚沒有網站系統能提供全面和專業的關鍵詞標引服務。泛域名技術能支持無限子域名, 中文關鍵詞作子域名能更直觀簡潔, 多編碼關鍵詞參照表便于靈活擴展。引入和結合泛中文域名解析思路, 設計構建全面關鍵詞表和簡潔添加超鏈接算法, 能有效解決目前關鍵詞鏈接中存在問題。開發實現通用網頁關鍵詞庫管理平臺和關鍵詞鏈接添加插件,能推廣適用于各類網站網頁和信息發布平臺。 2 關鍵詞庫構建 2.1 關鍵詞定義頁面中關鍵詞為直接從文章中抽取的自然語言( 自由詞) ,可能是規范術語、專用語或別名與簡稱, 具有一詞多義、多詞一義和詞義不清現象。關鍵詞表可參考但不限于《漢語主題詞表》、《醫學主題詞表》、《中醫藥主題詞表》等公認主題詞, 可能根據業務需要還有大量機構、企業或人物名,所有詞條均能對應到某主題或知識點。以醫療保健類為例,關鍵詞可包括中草藥名、中成藥名、方藥名、西藥名、疾病名、癥狀名、名醫名院、食物名、與生活保健相關的各要素、機構組織、國家法規等。其中有別名現象如惡性腫瘤與癌癥、胃十二指腸潰瘍與消化性潰瘍, 有簡稱現象如中華人民共和國衛生部與衛生部、乙型肝炎與乙肝, 此外, 為保證語義完整和劃詞準確, 一些慣用法詞句即使沒有對定專題介紹, 也可采用上位主題詞作關鍵詞進行保護和參照, 如兒茶酚***與兒茶酚***類、鼻炎與急性鼻炎、六味地黃與六味地黃丸、六味地黃口服液。 2.2 關鍵詞導向地址各關鍵詞均對應到一個知識點, 鏈接導向地址可以是一個網站地址、子站點或頻道欄目專題首頁、具體頁面或相關搜索頁面。如世界衛生組織可直接導向 WHO 網站、民族醫藥可鏈接至民族醫藥頻道、禽流感可鏈接禽流感專題、非典防治方案可鏈接到方案的全文頁。網站或課件中擁有大量知識信息素材, 為加強對熱點或知識點的展示, 在按常規頻道欄目或章節分類同時, 可進一步挖掘內容間關系加工重組出大量專題。建設過程中, 一些關鍵詞對應知識點地址無法確定,或因信息或欄目專題的調整導致某些頁面地址(URL) 變化, 常存在鍵詞條設置不全、無法指向正確頁面或已添加鏈接網頁需要重新生成等問題。只有關鍵詞本身是唯一的、確定的、不變的, 因此我們采用泛域名的映射解析技術, 將每一個關鍵詞作為二級域名。正如域名與 IP 地址關系一樣, 這種直接采用中文關鍵詞的域名方式, 相當于 URL 助記符,便于記憶,同時能保證鏈接穩定有效和導出設置靈活,當 URL 地址變化或指向需要調整時,只需修改對照表的相應記錄。 2.3 關鍵詞參照表關鍵詞表用于生成關鍵詞詞典文件和泛域名解析的重定向。其中關鍵詞列具唯一索引,參照詞用于解決多詞一義現象。關鍵詞、 Big5 碼、 IDN 編碼等列具有索引以提高解析速度。部分列數據冗余以避免嵌套查詢或反復編碼解碼操作。在關鍵詞表管理平臺中, 實現對 Big5 碼、 IDN 編碼列和若有參照詞時其鏈接地址列的自動維護。關鍵詞表可同時具有優先級別、廣告鏈接等屬性。關鍵詞鏈接地址參照詞 Big5 碼 IDN 編碼中華人民共和國衛生部/ 中華人民共和國衛生部 fiQ4Mp3EqsChE72E98Gko7CgbR kq7D 衛生部/ 中華人民共和國衛生部衛生部 rlR479Ey7S 食療 http://food. 食療 pqYp66E 三七/index/ tcm / herb/ 0131 /i ndex.htm 三七 7gQL 田七/index/ tcm / herb/ 0131 /i ndex.htm 三七田七 7gQx86G 高血壓/index/ disease /k158/index.htm 高血壓 omR993J8wL 高血壓病/index/ disease /k158/index.htm 高血壓高血壓病 omR890FqvM8qR 艾滋病防治條例/html/law/20060215.htm 愛滋病防治條例 fsQx49CoyDlmCf8Nk0T4q5A 寵物/index/health/topic/pet.htm 寵物 sbT234C 亞健康/index/health/topic//yjkhtm 亞健康 jlQp7Bi0Y 青春期/index/health/ /qcq.htm 青春期 qiVrVx07I …………… 3 泛中文域名解析 3.1 泛域名解析配置泛域名解析是指將*. 域名解析到同一 IP, 用于讓域名支持無限子域名和防止用戶錯誤輸入導致的無法正常訪問, 目前常用于博客系統, 但子域名均為英文字母和數字, 中文子域名由于編碼技術問題易造成無法正常訪問, 尚少見應用。配置方法是在 DNS 服務器的域名解析里面設置*. 的A ame 記錄指向某 IP 或者在域名轉發里面設置*. 轉發到 ,同時在此 IP 服務器上配置一個不指定主機頭的 we b 站點。 3.2 中文子域名編碼轉換目前 DNS 是7位 ASCII 編碼環境, 中文域名解析多以 PUNYCODE [2] 編碼進行兼容轉換。中文編碼格式有國際標準(UTF-8) 、國家標準(GB2312 , GBK) 和工業事實標準(BIG5) , 經過流覽器提交編碼后捕捉到的可能為國際化域名( IDN ) 或其它標準。NI C 的中文域名用戶插件、 TWNIC 的中文通、 NETSCAPE7.1 以上版本、 Mozilla browser-1. 4 以上版本、 Opera browser7.2 以上版本等支持和轉換 內容來自淘豆網www.yinxuefei.com轉載請標明出處.
    更多>> 相關文檔
    非法內容舉報中心
    文檔信息
    • 瀏覽:
    • 頁數:5
    • 收藏數:0 收藏
    • 頂次數:0
    • 上傳人:xxj16588
    • 時間:2016-07-09
    • 文件大小:0 KB
    • 下載次數:
    最近更新
    文檔標簽
    五省快三 江口县 | 青州市 | 巴彦淖尔市 | 古浪县 | 桦川县 | 彭州市 | 黄梅县 | 古蔺县 | 南部县 | 南溪县 | 栾川县 | 浦东新区 | 丰县 | 平南县 | 株洲市 | 岫岩 | 和顺县 | 高青县 | 湟源县 | 东港市 | 永兴县 | 潞城市 | 尉犁县 | 平果县 | 平陆县 | 寿光市 | 浦江县 | 临泽县 | 乌拉特前旗 | 龙川县 | 景洪市 | 乐至县 | 安宁市 | 嵩明县 | 安阳市 | 晋中市 | 陕西省 | 枞阳县 | 万安县 | 尼勒克县 | 廉江市 | 屏东县 | 高淳县 | 鄂州市 | 秀山 | 聂荣县 | 巴塘县 | 浙江省 | 申扎县 | 措美县 | 九龙城区 |