js66g 发表于 2024-5-11 17:08:04

TXT文档:章节序号重新排序。

原始文档的章节序号可能为错乱的(如310章后直接是312章),这中情况就需要章节名称重新校对。


校对前:

第三百一十章 千年前的封王事件
第三百一十二章 空灵悟道草
第三百一十三章 轮回深处是何物
第三百一十五章 真龙

校对后:

第310章 千年前的封王事件
第311章 空灵悟道草
第312章 轮回深处是何物
第313章 真龙

方案一:
通过python脚本实现章节名称重新排序

with codecs.open(wj,'r+','utf-8','ignore') as f:
      data = f.readlines()
      i=1
      for line in data:
            line=line.replace(u'\xa0','')
            line=re.sub(r'www\.ahfgb\.com|m\.ahfgb\.com|ŴŴŴ\.BIQUGE\.biz|M\.biQuge\.biZ','',line,flags=re.I)
            line=re.sub(r'ahfgb\.com|biQuge\.biZ|笔趣阁','',line,flags=re.I)
            line=re.sub(r'<br><br>','\r\n  ',line,flags=re.I)
            line=re.sub(r'<br>','',line,flags=re.I)
            line=re.sub(r'  <scriptapp2;<script\r\n','',line,flags=re.I)
            line=re.sub('【零↑九△小↓說△網】八壹|中文網|ζΘν€荳看書','',line)
            
            if re.findall(r'^  燃文小说网www\.ranwen8\.com,最快更新\r\n',line,re.I):
                continue
            elif re.findall(r'^  最新章节!\r\n',line,re.I):
                continue
            elif re.findall(r'^  无错小说网www\.wcxsw\.com(.+)',line,re.I):
                continue
            elif re.findall(r'^  \r\n',line,re.I):
                continue
            elif re.findall(r'^  【(.*)huanyuanapp(.*)】\r\n',line,re.I):
                continue
            elif re.findall(r'^第(.+?)章(.+?)',line,re.I):
                line = "第" + str(i) + "章 " + line.split('章',1)[-1].strip()
                i=i+1
            line=line.strip('\r\n')
            print("{0}".format(line),file=file2)

页: [1]
查看完整版本: TXT文档:章节序号重新排序。