a亚洲精品_精品国产91乱码一区二区三区_亚洲精品在线免费观看视频_欧美日韩亚洲国产综合_久久久久久久久久久成人_在线区

首頁 > 編程 > JSP > 正文

Jsp敏感詞過濾的示例代碼

2024-09-05 00:23:18
字體:
來源:轉載
供稿:網友

大部分論壇、網站等,為了方便管理,都進行了關于敏感詞的設定。

在多數網站,敏感詞一般是指帶有敏感政治傾向(或反執政黨傾向)、暴力傾向、不健康色彩的詞或不文明語,也有一些網站根據自身實際情況,設定一些只適用于本網站的特殊敏感詞。

比如,當你發貼的時候帶有某些事先設定的詞時,這個貼是不能發出的。或者這個詞被自動替換為星號(*)或叉號(X)等,或者說是被和諧掉了。

在我看來敏感詞過濾最重要的是在寫過濾詞匯的算法,如何過濾出大批量的敏感詞,我感覺DFA的思想不錯

DFA簡介

在實現文字過濾的算法中,DFA是唯一比較好的實現算法。DFA即Deterministic Finite Automaton,也就是確定有窮自動機,它是是通過event和當前的state得到下一個state,即event+state=nextstate。下圖展示了其狀態的轉換

Jsp,敏感詞,過濾

在這幅圖中大寫字母(S、U、V、Q)都是狀態,小寫字母a、b為動作。通過上圖我們可以看到如下關系

a b b
S -----> U S -----> V U -----> V

在實現敏感詞過濾的算法中,我們必須要減少運算,而DFA在DFA算法中幾乎沒有什么計算,有的只是狀態的轉換。

Java實現DFA算法實現敏感詞過濾

在Java中實現敏感詞過濾的關鍵就是DFA算法的實現。首先我們對上圖進行剖析。在這過程中我們認為下面這種結構會更加清晰明了。

Jsp,敏感詞,過濾

同時這里沒有狀態轉換,沒有動作,有的只是Query(查找)。我們可以認為,通過S query U、V,通過U query V、P,通過V query U P。通過這樣的轉變我們可以將狀態的轉換轉變為使用Java集合的查找。

誠然,加入在我們的敏感詞庫中存在如下幾個敏感詞:日本人、日本鬼子、毛.澤.東。那么我需要構建成一個什么樣的結構呢?

首先:query 日 ---> {本}、query 本 --->{人、鬼子}、query 人 --->{null}、query 鬼 ---> {子}。形如下結構:

Jsp,敏感詞,過濾

下面我們在對這圖進行擴展:

Jsp,敏感詞,過濾

 這樣我們就將我們的敏感詞庫構建成了一個類似與一顆一顆的樹,這樣我們判斷一個詞是否為敏感詞時就大大減少了檢索的匹配范圍。比如我們要判斷日本人,根據第一個字我們就可以確認需要檢索的是那棵樹,然后再在這棵樹中進行檢索。

這個思想留著以后用,我先寫一個過濾詞匯的一些簡單方法,沒有涉及到算法

Java代碼實現

基本思路:重寫HttpServletRequestWrapper中的getParameter方法,讓用戶輸入的字通過這個過濾,寫一個類繼承他,重寫方法,在寫一個過濾詞匯的詞典,來與輸入的對比

先寫一個jsp頁面,js是用Ajax去刷新的,最近學的想用用試試看,感覺不錯,Ajax是需要引js文件的 

<body>  <input type="text" name="word" onblur="filter(this.value);" id="filter"/>  <input type="submit" value="敏感詞過濾" /><script type="text/javascript" src="js/jquery.js"></script><script type="text/javascript">  function filter(num){    $.ajax({      type:"post",//提交方式      url:"FilterWordServlet",      async:true,//是否異步請求      dataType:"html",//數據的返回類型      data:{"num":num},//數據傳過去的值      success:function(data,textStatus){//成功的執行之后,回調這個函數處理事務        $("#filter").val(data);      },      error:function(){//失敗執行這個函數,處理失敗的事務        alert("error");      }    })  }</script></body>

再繼承HttpServletRequestWrapper在重寫getParameter方法,

//主要思路是繼承HttpServletRequestWrapper,去改寫他的getParameter方法,讓其有過濾的業務public class WordFilter extends HttpServletRequestWrapper{  public WordFilter(HttpServletRequest request) {    super(request);    // TODO Auto-generated constructor stub  }  @Override  public String getParameter(String name){    //先得到父親的方法,傳入值,得到的值在跟過濾字典中的比較看是否含有,有則替換,沒有放過返回    String word=super.getParameter(name);    //調用字典中的文字    List<String> list=Words.getList();    for (String string : list) {      //判斷是否含有這樣字典中的文字      if (word.contains(string)) {          //將字符串中含有的替換掉        word=word.replace(string, "**");      }    }    return word;  }  }

再寫一個Servlet,去獲取用戶輸入的字,進行過濾操作 

@WebServlet("/FilterWordServlet")public class FilterWordServlet extends HttpServlet {  private static final long serialVersionUID = 1L;  protected void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {    //設置請求和編碼格式    request.setCharacterEncoding("utf-8");    response.setCharacterEncoding("utf-8");    //自己創建的請求方法,繼承與原來的,改寫了getParameter方法讓其有過濾的業務    WordFilter wFilter=new WordFilter(request);     String string=wFilter.getParameter("num");     System.out.println("---------------");     //out的響應方法。輸出在頁面上,讓ajax得到這個去處理一些業務     PrintWriter out=response.getWriter();     out.println(string);       }    protected void doPost(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {    // TODO Auto-generated method stub    doGet(request, response);  }}

我自己建了一個list集合的過濾詞匯,以后修改可以從這里開始詞匯的搜索算法,先建一個詞匯類

public class Words {  //過濾詞匯的詞典  static List<String> list=new ArrayList<>();  static{    list.add("你妹的");    list.add("sb");    list.add("滾");  }  public static List<String> getList() {    return list;  }  public static void setList(List<String> list) {    Words.list = list;  }  }

這只是最基礎的一種。高級的需要算法的實現,可以思考一下這個DFA算法,我感覺很不錯

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持VeVb武林網。


注:相關教程知識閱讀請移步到JSP教程頻道。
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 国产福利91精品一区二区三区 | 欧美一区 | 国产精品揄拍一区二区久久国内亚洲精 | 亚洲一区二区精品视频 | 免费观看一级特黄欧美大片 | 国产黄色大片 | 一区二区免费看 | 亚洲黄色在线免费观看 | 亚洲天堂在线视频播放 | 日韩一区二区三区免费视频 | 日韩一级免费观看 | 中文字幕国产 | 亚洲一区二区三区国产 | 欧美国产精品一区 | 久久一区二区视频 | а天堂中文最新一区二区三区 | 国产精品国产三级国产普通话蜜臀 | 四虎8848精品成人免费网站 | 亚洲精品乱码久久久久久金桔影视 | 久久精品一区二区三区四区 | 亚洲xxxxx| 男人的天堂在线视频 | 欧美精品久久一区 | 黄色片在线免费观看 | 国产精品久久久久久久久久久久久 | 久久久久久久爱 | 一级毛片国产 | 久久精品综合 | 亚洲精品乱码久久观看网 | 免费毛片一区二区三区久久久 | 在线中文字幕播放 | 国产电影一区二区三区图片 | 亚洲精品福利 | 91亚洲精品乱码久久久久久蜜桃 | 精品美女在线观看视频在线观看 | jjzz日本| 国产成人综合在线 | 香蕉婷婷 | 亚洲一区在线视频 | 黑人巨大精品欧美一区二区小视频 | 手机看片福利视频 |