国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

5083-Bigram 分詞

wwolf / 465人閱讀

摘要:前言的分詞給出第一個詞和第二個詞,考慮在某些文本中可能以形式出現的情況,其中緊隨出現,緊隨出現。對于每種這樣的情況,將第三個詞添加到答案中,并返回答案。

前言

Weekly Contest 140的 Bigram 分詞:

</>復制代碼

  1. 給出第一個詞 first 和第二個詞 second,考慮在某些文本 text 中可能以 "first second third" 形式出現的情況,其中 second 緊隨 first 出現,third 緊隨 second 出現。

  2. 對于每種這樣的情況,將第三個詞 "third" 添加到答案中,并返回答案。

  3. 示例1:

  4. </>復制代碼

    1. 輸入:text = "alice is a good girl she is a good student", first = "a", second = "good"
    2. 輸出:["girl","student"]
  5. 示例2:

  6. </>復制代碼

    1. 輸入:text = "we will we will rock you", first = "we", second = "will"
    2. 輸出:["we","rock"]
  7. 提示:

  8. 1 <= text.length <= 1000

  9. text 由一些用空格分隔的單詞組成,每個單詞都由小寫英文字母組成

  10. 1 <= first.length, second.length <= 10

  11. first second 由小寫英文字母組成

解題思路

本題需要注意以下兩點:

first second third三個單詞是要連續出現的,例如

</>復制代碼

  1. 輸入:text = "alice is a good girl she is a really good student", first = "a", second = "good"
  2. 輸出:["girl"]

first second third三個單詞中的third可能是下一次循環的first,例如示例2

實現代碼

</>復制代碼

  1. /**
  2. * 5083. Bigram 分詞
  3. * @param text
  4. * @param first
  5. * @param second
  6. * @return
  7. */
  8. public String[] findOcurrences(String text, String first, String second) {
  9. // 按空格分割單詞
  10. String[] words = text.split(" ");
  11. List list = new ArrayList<>();
  12. // 匹配第一個單詞的索引
  13. int firstIndex = -1;
  14. // 匹配第二個單詞的索引
  15. int secondIndex = -1;
  16. for (int i = 0; i < words.length; i++) {
  17. String word = words[i];
  18. if (firstIndex >= 0 && secondIndex > 0) { // 判斷前兩個單詞是否已經匹配
  19. firstIndex = -1; // 重置索引
  20. secondIndex = -1; // 重置索引
  21. list.add(word);
  22. }
  23. // 判斷是否為第二個單詞,判斷條件為
  24. // 1. 當前單詞與第二個單詞相同
  25. // 2. 第一個單詞已經匹配
  26. // 3. 第二個單詞緊跟著第一個單詞之后出現(secondIndex = firstIndex+1)
  27. // 此處先判斷第二個單詞是為了處理第三個單詞為第一個單詞的情況
  28. if (word.equals(second) && firstIndex >= 0 && firstIndex == i - 1) {
  29. secondIndex = i;
  30. continue; // 匹配則中斷當前循環
  31. } else {
  32. // 第一個單詞已經匹配,但是第二個單詞不匹配,重置第一個單詞的匹配結果
  33. if (firstIndex >= 0) {
  34. firstIndex = -1;
  35. }
  36. }
  37. // 判斷是否為第一個單詞
  38. // 1. 第一個單詞未匹配
  39. // 2. 當前單詞與第一個單詞相同
  40. if (firstIndex < 0 && word.equals(first)) {
  41. firstIndex = i;
  42. continue; // 匹配則中斷當前循環
  43. }
  44. }
  45. String[] result = new String[list.size()];
  46. return list.toArray(result);
  47. }

文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。

轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/74893.html

相關文章

  • 推薦十款java開源中文分詞組件

    摘要:最初,它是以開源項目為應用主體的,結合詞典分詞和文法分析算法的中文分詞組件。填補了國內中文分詞方面開源組件的空白,致力于此并希翼成為互聯網網站首選的中文分詞開源組件。中文分詞追求分詞的高效率和用戶良好體驗。 1:Elasticsearch的開源中文分詞器 IK Analysis(Star:2471) IK中文分詞器在Elasticsearch上的使用。原生IK中文分詞是從文件系統中讀取...

    masturbator 評論0 收藏0
  • 分詞,難在哪里?科普+解決方案!

    摘要:分詞的算法中文分詞有難度,不過也有成熟的解決方案。例如通過人民日報訓練的分詞系統,在網絡玄幻小說上,分詞的效果就不會好。三的優點是開源的,號稱是中,最好的中文分詞組件。 showImg(https://segmentfault.com/img/remote/1460000016359704?w=1350&h=900); 題圖:by Lucas Davies 一、前言 分詞,我想是大多數...

    Steven 評論0 收藏0

發表評論

0條評論

最新活動
閱讀需要支付1元查看
<