使用python
用到的包:xml.dom.minidom
需求:
有一个表,里面数据量比较大,每天一更新,其字段可以通过配置文件进行配置,即,可能每次建表的字段不一样。
上游跑时会根据配置从源文件中提取,到入库这一步需要根据配置进行建表。
解决:
写了一个简单的xml,配置需要字段及类型
上游读取到对应的数据
入库这一步,先把原表删除,根据配置建新表
XML文件
脚本:
涉及方法:
root = minidom.parse(xml_file_path) 获取dom对象
root.getElementsByTagName("table") 根据tag获取节点列表
table.getAttribute("name") 获取属性
primary_key.getElementsByTagName("name")[0].childNodes[0].nodeva lue 获取子节点的值(id 得到id)
-----------------------------------------------------
简单的读取就是这样,这里只是简单使用了下
后续需去了解下python读取xml的几个库
xml.dom.minidom
xml.etree.ElementTree
libxml2
lxml.etree
xpath