python3 讀寫文件換行符


最近在處理文本文件時,遇到編碼格式和換行符的問題。

基本上都是GBK 和 UTF-8 編碼的文本文件,但是python3 中默認的都是按照 utf-8 來打開。用不正確的編碼參數打開,在讀取內容時,會拋出異常。

open(dirpath + "\\" + file, mode = "r+", encoding = "gbk", newline = "")

捕獲拋出的異常,關閉文件。使用另外一種編碼格式打開文件再重新讀取。

讀取文件時,

newline參數用來指定讀取時,對換行符的處理。缺省為 None,表示通用的換行符(“\n”),即文件的換行符是啥,讀出來都是 “\n”.

newline = ""  表示讀取的換行符保持不變,原來是啥,讀出來還是啥。

newline = “\n”  表示遇到 "\n" 才一行結束,“\r” 像其他普通字符一樣對待。

newline = “\r”  表示遇到 "\r" 才一行結束,“\n” 像其他普通字符一樣對待。


在文件寫入時,

newline = None時,寫入的“\n” 自動都變為系統默認的換行符。所以 “\r\n” 在windows下會變成“\r\r\n”寫入。

newline = ""  表示不做任何轉換寫入。

newline = “\n”  表示不做任何轉換寫入。

newline = “\r”  表示將 “\n” 和 "\r" 都當做 "\r" 進行寫入,所以“\r\n” 會變成 “\r\r”進行寫入。


案例:將源碼下的所有makefile 文件中的 -c 參數前,加上 -g 選項。

import os
import re

os.chdir(r"E:\code")
s = os.walk(".")
pattern = re.compile(r"\s-c\s")
for dirpath, dirnames, filenames in s:
for file in filenames:
if file.endswith(".mak") or "makefile" in file: #部分以 .mak 結尾,部分以makefile命名
print(file)
with open(dirpath + "\\" + file, mode = "r+", encoding = "gbk", newline = "") as f: #newline為空串表示換行符不轉換
try: #編碼問題造成的異常
lines = f.readlines() #一次讀取所有的行到內存
f.seek(0) #回到文件起始處
for line in lines:
#newline = line.replace(" -c "," -g -c ")
newline= re.sub(pattern, " -g -c ", line)
f.write(newline)
except ValueError:
f.close()
with open(dirpath + "\\" + file, mode = "r+", encoding = "utf-8", newline = "") as fnew:
try:
lines = fnew.readlines()
fnew.seek(0)
for line in lines:
#newline = line.replace(" -c "," -g -c ")
newline= re.sub(pattern, " -g -c ", line)
fnew.write(newline)
except ValueError:
print("*************** " + dirpath + "\\" + file) #打印utf-8 和 gbk 之外編碼的文件名




注意!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系我们删除。



 
粤ICP备14056181号  © 2014-2021 ITdaan.com