python实现Markdown转html

女人容颜逝去要十年,男人贬值不过一瞬间。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
import sys
import os

from bs4 import BeautifulSoup
import markdown


class MarkdownToHtml:

headTag = '<head><meta charset="utf-8" /></head>'

def __init__(self, cssFilePath = None):
if cssFilePath != None:
self.genStyle(cssFilePath)

def genStyle(self,cssFilePath):
with open(cssFilePath,'r') as f:
cssString = f.read()
self.headTag = self.headTag[:-7] + '<style type="text/css">{}</style>'.format(cssString) + self.headTag[-7:]

def markdownToHtml(self,**arguments):
if 'sourceFilePath' in arguments:
sourceFilePath = arguments['sourceFilePath']
else:
return
if 'destinationDirectory' in arguments:
destinationDirectory = arguments['destinationDirectory']
else:
# 未定义输出目录则将源文件目录(注意要转换为绝对路径)作为输出目录
destinationDirectory = os.path.dirname(os.path.abspath(sourceFilePath))
if 'outputFileName' in arguments:
outputFileName = arguments['outputFileName']
else:
# 未定义输出文件名则沿用输入文件名
outputFileName = os.path.splitext(os.path.basename(sourceFilePath))[0] + '.html'
if destinationDirectory[-1] != '/':
destinationDirectory += '/'
with open(sourceFilePath,'r', encoding='utf8') as f:
markdownText = f.read()
# 编译出原始 HTML 文本
rawHtml = self.headTag + markdown.markdown(markdownText,output_format='html5')
# 格式化 HTML 文本为可读性更强的格式
beautifyHtml = BeautifulSoup(rawHtml,'html5lib').prettify()
with open(destinationDirectory + outputFileName, 'w', encoding='utf8') as f:
f.write(beautifyHtml)

if __name__ == "__main__":
mth = MarkdownToHtml()
# 做一个命令行参数列表的浅拷贝,不包含脚本文件名
argv = sys.argv[1:]
# 目前列表 argv 可能包含源文件路径之外的元素(即选项信息)
# 程序最后遍历列表 argv 进行编译 markdown 时,列表中的元素必须全部是源文件路径
if '-s' in argv:
cssArgIndex = argv.index('-s') +1
cssFilePath = argv[cssArgIndex]
# 检测样式表文件路径是否有效
if not os.path.isfile(cssFilePath):
print('Invalid Path: ' + cssFilePath)
sys.exit()
mth.genStyle(cssFilePath)
# POP顺序不能随意变化
argv.pop(cssArgIndex)
argv.pop(cssArgIndex-1)
if '-o' in argv:
dirArgIndex = argv.index('-o') +1
outputDirectory = argv[dirArgIndex]
# 检测输出目录是否有效
if not os.path.isdir(outputDirectory):
print('Invalid Directory: ' + outputDirectory)
sys.exit()
# POP顺序不能随意变化
argv.pop(dirArgIndex)
argv.pop(dirArgIndex-1)
argumentsList = [dict([('sourceFilePath',filePath), ('destinationDirectory',outputDirectory)]) for filePath in argv]
else:
argumentsList = [dict([('sourceFilePath',filePath)]) for filePath in argv]
# 至此,列表 argv 中的元素均是源文件路径
for argument in argumentsList:
# 检测文件路径是否有效
if os.path.isfile(argument['sourceFilePath']):
mth.markdownToHtml(**argument)
else:
print('Invalid Path: '+argument['sourceFilePath'])