收藏一個(gè)python通過uft8 編碼來提取中文的例子

baiy 發(fā)布于2019-07-24 17:53 / 2745人閱讀

摘要：提取文件中所有中文小程序問題描述從一個(gè)文件中提取所有中文思路打開文件讀取文件中的文本用正則匹配獲取中文將其內(nèi)容寫入到另一個(gè)文本中實(shí)現(xiàn)設(shè)置默認(rèn)編碼只能是下面要求的判斷是否為中文的正則表達(dá)式打開要提取的文件打開要寫入的文件循環(huán)讀取要讀

Python-提取文件中所有中文小程序
問題描述：

　　　從一個(gè)txt文件中提取所有中文

思路：

打開txt文件
讀取txt文件中的文本
用正則匹配獲取中文
將其內(nèi)容寫入到另一個(gè)文本中
python實(shí)現(xiàn)：
import imp
import sys
imp.reload(sys)
sys.setdefaultencoding("utf-8") #設(shè)置默認(rèn)編碼,只能是utf-8,下面u4e00-u9fa5要求的
import re
pchinese=re.compile("([u4e00-u9fa5]+)+?") #判斷是否為中文的正則表達(dá)式
f=open("data.txt") #打開要提取的文件
fw=open("getdata.txt","w")#打開要寫入的文件
for line in f.readlines(): #循環(huán)讀取要讀取文件的每一行
m=pchinese.findall(str(line)) #使用正則表達(dá)獲取中文
if m:
str1="|".join(m)#同行的中文用豎杠區(qū)分
str2=str(str1)
fw.write(str2)#寫入文件
fw.write(" ")#不同行的要換行
f.close()
fw.close()#打開的文件記得關(guān)閉哦!

未驗(yàn)證

云服務(wù)器 GPU云服務(wù)器收藏一個(gè)代碼簡單的python例子 asp 編碼中文一個(gè)完整的python程序

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://m.specialneedsforspecialkids.com/yun/37489.html

發(fā)表評論

登陸后可評論

0條評論

baiy

男|高級講師

我要關(guān)注我要私信

TA的文章

虛擬主機(jī)怎么上傳文件-虛擬主機(jī)怎么上傳文件？

閱讀 804·2021-09-22 16:01
Contabo，新增NVME硬盤，加1歐可以升級 100G NVMe

閱讀 2095·2021-08-20 09:37
CSS小技巧（一）：iconfont的使用

閱讀 1700·2019-08-30 15:54
小程序?qū)崿F(xiàn)橫向滑塊，超過10個(gè)則出現(xiàn)查看更多

閱讀 1699·2019-08-30 15:44
文檔合集

閱讀 843·2019-08-28 18:23
JavaScript學(xué)習(xí)第十天筆記（繼承）

閱讀 3021·2019-08-26 12:17
Node.js child_process模塊解讀

閱讀 1023·2019-08-26 11:56
vue-cli中怎么基于axios去封裝方法

閱讀 1546·2019-08-23 16:20

国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

收藏一個(gè)python通過uft8 編碼來提取中文的例子

相關(guān)文章

首次公開，整理12年積累的博客收藏夾，零距離展示《收藏夾吃灰》系列博客

**unicode和utf8 —— 從一個(gè)遍歷文件名的腳本，談?wù)剬?em>Python2和Python3中字符編**

BeautifulSoup：網(wǎng)頁解析利器上手簡介

發(fā)表評論

0條評論

baiy

男|高級講師

TA的文章

虛擬主機(jī)怎么上傳文件-虛擬主機(jī)怎么上傳文件？

Contabo，新增NVME硬盤，加1歐可以升級 100G NVMe

CSS小技巧（一）：iconfont的使用

小程序?qū)崿F(xiàn)橫向滑塊，超過10個(gè)則出現(xiàn)查看更多

文檔合集

JavaScript學(xué)習(xí)第十天筆記（繼承）

Node.js child_process模塊解讀

vue-cli中怎么基于axios去封裝方法

最新活動