时光留影论坛-CNSGLY.NET

 找回密码
 立即注册
搜索
热搜: CCTV 精校
查看: 181|回复: 0

TXT文档:查找“八九问题”文件。

[复制链接]

3万

主题

6

回帖

40万

积分

版主

Rank: 7Rank: 7Rank: 7

积分
406131
发表于 2024-6-16 01:05:38 | 显示全部楼层 |阅读模式
本帖最后由 js66g 于 2024-6-18 23:41 编辑

“八九问题”:
TXT文档中的星号敏感词(如“八九”敏感词)没经过校对而直接删除星号符,导致文档中字句不完整(缺“八九”字符),此种TXT文档姑且称之为“八九问题”。

场景:
1.文件夹中有1000个文件
2.查找有“八九问题”的文档

方案:
  1. filenames_1 = os.listdir(path_1)
  2. for filename_1 in filenames_1:
  3.      file3=codecs.open(os.path.join(path_1,filename_1),'r','utf-8')
  4.      html_doc=file3.read()
  5.      list_bajiu=["八九","独立","赤裸","汪洋","兽交","隐私","炸药","情色","高潮","大法"]
  6.      if "八九" not in html_doc:
  7.          print("bajiu result found..."+filename_1)
  8.          file3.close()
  9.          shutil.move(os.path.join(path_1,filename_1),os.path.join(path_3,filename_1))   
复制代码






留不住时光,那就留住回忆!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

时光留影论坛-CNSGLY.NET

GMT+8, 2024-9-8 10:02

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表