时光留影论坛-CNSGLY.NET

 找回密码
 立即注册
搜索
热搜: CCTV 精校
查看: 699|回复: 0

TXT文档:章节序号重新排序。

[复制链接]

3万

主题

7

回帖

44万

积分

版主

Rank: 7Rank: 7Rank: 7

积分
441891
发表于 2024-5-11 17:08:04 | 显示全部楼层 |阅读模式
原始文档的章节序号可能为错乱的(如310章后直接是312章),这中情况就需要章节名称重新校对。


校对前:

第三百一十章 千年前的封王事件
第三百一十二章 空灵悟道草
第三百一十三章 轮回深处是何物
第三百一十五章 真龙

校对后:

第310章 千年前的封王事件
第311章 空灵悟道草
第312章 轮回深处是何物
第313章 真龙

方案一:
通过python脚本实现章节名称重新排序

  1. with codecs.open(wj,'r+','utf-8','ignore') as f:
  2.         data = f.readlines()
  3.         i=1
  4.         for line in data:
  5.             line=line.replace(u'\xa0','')
  6.             line=re.sub(r'www\.ahfgb\.com|m\.ahfgb\.com|ŴŴŴ\.BIQUGE\.biz|M\.biQuge\.biZ','',line,flags=re.I)
  7.             line=re.sub(r'ahfgb\.com|biQuge\.biZ|笔趣阁','',line,flags=re.I)
  8.             line=re.sub(r'<br><br>','\r\n  ',line,flags=re.I)
  9.             line=re.sub(r'<br>','',line,flags=re.I)
  10.             line=re.sub(r'  <scriptapp2;<script\r\n','',line,flags=re.I)
  11.             line=re.sub('【零↑九△小↓說△網】八壹|中文網|ζΘν€荳看書','',line)
  12.             
  13.             if re.findall(r'^  燃文小说网www\.ranwen8\.com,最快更新\r\n',line,re.I):
  14.                 continue
  15.             elif re.findall(r'^  最新章节!\r\n',line,re.I):
  16.                 continue
  17.             elif re.findall(r'^  无错小说网www\.wcxsw\.com(.+)',line,re.I):
  18.                 continue
  19.             elif re.findall(r'^  \r\n',line,re.I):
  20.                 continue
  21.             elif re.findall(r'^  【(.*)huanyuanapp(.*)】\r\n',line,re.I):
  22.                 continue
  23.             elif re.findall(r'^第(.+?)章(.+?)',line,re.I):
  24.                 line = "第" + str(i) + "章 " + line.split('章',1)[-1].strip()
  25.                 i=i+1
  26.             line=line.strip('\r\n')
  27.             print("{0}".format(line),file=file2)
复制代码


留不住时光,那就留住回忆!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

时光留影论坛-CNSGLY.NET

GMT+8, 2024-11-21 16:45

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表