a亚洲精品_精品国产91乱码一区二区三区_亚洲精品在线免费观看视频_欧美日韩亚洲国产综合_久久久久久久久久久成人_在线区

首頁 > 編程 > C > 正文

字典樹的基本知識及使用C語言的相關實現

2020-01-26 14:59:42
字體:
來源:轉載
供稿:網友

概念

     如果我們有and,as,at,cn,com這些關鍵詞,那么trie樹(字典樹)是這樣的:

201587113000993.png (702×500)

     從上面的圖中,我們或多或少的可以發現一些好玩的特性。

      第一:根節點不包含字符,除根節點外的每一個子節點都包含一個字符。

      第二:從根節點到某一節點,路徑上經過的字符連接起來,就是該節點對應的字符串。

      第三:每個單詞的公共前綴作為一個字符節點保存。

 

使用范圍

     既然學Trie樹,我們肯定要知道這玩意是用來干嘛的。

     第一:詞頻統計。

            可能有人要說了,詞頻統計簡單啊,一個hash或者一個堆就可以打完收工,但問題來了,如果內存有限呢?還能這么

             玩嗎?所以這里我們就可以用trie樹來壓縮下空間,因為公共前綴都是用一個節點保存的。

     第二: 前綴匹配

            就拿上面的圖來說吧,如果我想獲取所有以"a"開頭的字符串,從圖中可以很明顯的看到是:and,as,at,如果不用trie樹,

            你該怎么做呢?很顯然樸素的做法時間復雜度為O(N2) ,那么用Trie樹就不一樣了,它可以做到h,h為你檢索單詞的長度,

            可以說這是秒殺的效果。

數據結構定義

  #define MAX 26 // 字符集大小      typedef struct trieNode {     struct trieNode *next[MAX];     int count; // 記錄該字符出現次數   } trieNode; 


next數組表示每層有多少類的數,如果只是小寫字母,26即可


實現方法
搜索字典項目的方法:

  •     從根節點開始一次搜索
  •     獲取要查找關鍵詞的第一個字母,并根據該字母選擇對應的子樹并轉到該子樹繼續進行檢索
  •     在相應的子樹上,獲取要查找關鍵詞的第二個字母,并進一步選擇對應的子樹進行檢索
  •     迭代過程
  •     在某個節點處,關鍵詞的所有字母已被取出,則讀取附在該結點上的信息,即完成查找


其他操作類似


實現模板

初始化根結點

  /**    * 初始化Trie樹根結點    */   void initTrie(trieNode **root)   {     int i;        *root = (trieNode *)malloc(sizeof(trieNode));     (*root)->count = 0;        for (i = 0; i < MAX; i ++) {       (*root)->next[i] = NULL;     }   } 

插入單詞到trie樹

 

  /**    * Trie樹插入操作    */   void insert(char *str, trieNode *root)   {     int i;        trieNode *p = root;        while (*str != '/0') {       if (p->next[*str - 'a'] == NULL) {         trieNode *tmp = (trieNode *)malloc(sizeof(trieNode));         for (i = 0; i < MAX; i ++) {           tmp->next[i] = NULL;         }         tmp->count = 1;         p->next[*str - 'a'] = tmp;         p = p->next[*str - 'a'];       } else {         p = p->next[*str - 'a'];         p->count ++;       }          str ++;     }   } 

統計查找單詞數量

  /**    * 統計前綴出現次數    */   int count(char *search, trieNode *root)   {     trieNode *p = root;        while (*search != '/0') {       if (p->next[*search - 'a'] == NULL) {         return 0;       } else {         p = p->next[*search - 'a'];         search ++;       }     }        return p->count;   } 


清理trie樹

  /**    * 清理trie樹    */   void delTrie(trieNode *root)   {     int i;        for (i = 0; i < MAX; i ++) {       if (root->next[i] != NULL) {         delTrie(root->next[i]);       }     }        free(root);   } 

時間復雜度
插入、查找的時間復雜度均為O(n),n為字符串的長度

空間復雜度較高,O(26^n),典型空間換時間


參考題目

ac代碼:

 

  #include <stdio.h>   #include <stdlib.h>   #include <string.h>      #define MAX 26 // 字符集大小      typedef struct trieNode {     struct trieNode *next[MAX];     int count; // 記錄該字符出現次數   } trieNode;         /**    * 初始化Trie樹根結點    */   void initTrie(trieNode **root)   {     int i;        *root = (trieNode *)malloc(sizeof(trieNode));     (*root)->count = 0;        for (i = 0; i < MAX; i ++) {       (*root)->next[i] = NULL;     }   }      /**    * Trie樹插入操作    */   void insert(char *str, trieNode *root)   {     int i;        trieNode *p = root;        while (*str != '/0') {       if (p->next[*str - 'a'] == NULL) {         trieNode *tmp = (trieNode *)malloc(sizeof(trieNode));         for (i = 0; i < MAX; i ++) {           tmp->next[i] = NULL;         }         tmp->count = 1;         p->next[*str - 'a'] = tmp;         p = p->next[*str - 'a'];       } else {         p = p->next[*str - 'a'];         p->count ++;       }          str ++;     }   }      /**    * 統計前綴出現次數    */   int count(char *search, trieNode *root)   {     trieNode *p = root;        while (*search != '/0') {       if (p->next[*search - 'a'] == NULL) {         return 0;       } else {         p = p->next[*search - 'a'];         search ++;       }     }        return p->count;   }      /**    * 清理trie樹    */   void delTrie(trieNode *root)   {     int i;        for (i = 0; i < MAX; i ++) {       if (root->next[i] != NULL) {         delTrie(root->next[i]);       }     }        free(root);   }         int main(void)   {     char str[15];     trieNode *root;        // 初始化根結點     initTrie(&root);        while (gets(str) && str[0] != '/0') {       // 插入Trie樹       insert(str, root);     }        // 查找前綴出現次數     while (gets(str) && str[0] != '/0') {       printf("%d/n", count(str, root));     }        delTrie(root);        return 0;   } 

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表

圖片精選

主站蜘蛛池模板: 91午夜激情| 亚洲不卡| 丁香五月网久久综合 | 中文字幕在线观看第一页 | 久久伊人国产 | a在线观看免费视频 | 国产精品久久久久久妇女6080 | 久操国产 | 四虎影音 | 成人日韩 | 国产区在线观看 | 日韩视频精品在线 | 日日爱视频| 亚洲一区二区精品视频 | 欧美日韩精品一区 | 精品久久久久一区二区三区 | 成人精品视频 | 国产精品久久久久无码av | 荡女妇边被c边呻吟视频 | 日韩一区二区精品 | 伊人网一区 | 自拍色图 | 国产精品久久久久久久免费大片 | 日韩欧美综合在线 | 亚洲国产精品一区 | 日日摸夜夜添夜夜添亚洲女人 | 欧美性猛交一区二区三区精品 | 精品在线免费视频 | 久草在线资源福利站 | 国产日韩欧美 | 国产精品1区2区 | 美国一级黄色片 | 中文字幕在线免费视频 | 欧美精品综合在线 | 亚洲视频在线一区 | 久草在线在线精品观看 | av在线一区二区三区 | 在线一区二区三区 | 色图一区| 理论黄色片| 99热精品久久 |