新聞中心
數(shù)據(jù)是互聯(lián)網(wǎng)的靈魂、沒(méi)有數(shù)據(jù)互聯(lián)網(wǎng)就是一個(gè)無(wú)用的空殼子,像人工智能、大數(shù)據(jù)、智能算法等。都是需要基礎(chǔ)數(shù)據(jù)來(lái)驗(yàn)證模型是否是可用的,來(lái)進(jìn)行調(diào)參矯正算法的可用性、幫助算法的落地,對(duì)算法起到最關(guān)鍵的作用。所以數(shù)據(jù)的獲取以及對(duì)數(shù)據(jù)的處理就是非常重要的。

從網(wǎng)站建設(shè)到定制行業(yè)解決方案,為提供網(wǎng)站制作、成都網(wǎng)站建設(shè)服務(wù)體系,各種行業(yè)企業(yè)客戶(hù)提供網(wǎng)站建設(shè)解決方案,助力業(yè)務(wù)快速發(fā)展。創(chuàng)新互聯(lián)將不斷加快創(chuàng)新步伐,提供優(yōu)質(zhì)的建站服務(wù)。
通常的數(shù)據(jù)格式是txt、sql、excel以及word,其中最重要的還是SQL中的數(shù)據(jù)、SQL數(shù)據(jù)包括MySQL、SQLServer、SQLite、Oracle等,導(dǎo)出的數(shù)據(jù)格式。 常用的數(shù)據(jù)處理語(yǔ)言是Python、因?yàn)镻ython是個(gè)膠水語(yǔ)言,沒(méi)有Python搞不定的事。 Python比較適合做些快速、時(shí)間緊、參與人員較少,切性能要求不高的項(xiàng)目,而且Python成熟的庫(kù)很多、這也是它 被稱(chēng)為 膠水語(yǔ)言的原因 。
技術(shù)要求需要懂得python3的基礎(chǔ)語(yǔ)法以及對(duì)正則表達(dá)式有基礎(chǔ)了解。
實(shí)現(xiàn)步驟
1.讀取SQL文件中的數(shù)據(jù)、去除多余的內(nèi)容并提取需要的數(shù)據(jù)、追加到集合中;
# -*- coding: utf-8 -*-
# !/usr/bin/python3
# desc by: 兩行代碼實(shí)現(xiàn)SQL文件中數(shù)據(jù)提取,后期可以結(jié)合geogle瀏覽器插件應(yīng)用
# author by : rainNight
# weChatPublicNumber: 雨夜的博客
import re
import json
"""
第一步:讀取area.sql文件,去除多余內(nèi)容提取需要添加的數(shù)據(jù)
第二步:定義轉(zhuǎn)換后的文件地址,寫(xiě)入文件
"""
opens = open("./data/area.sql", encoding="utf-8")
codeline = opens.readlines() # 一行一行的讀取
jsonList = []
for line in codeline:
if re.match("INSERT", line):
jsonList.append(re.findall(re.compile(r'[(](.*?)[)]', re.S), line))
2.將集合中的數(shù)據(jù)轉(zhuǎn)成json格式;
3.定義轉(zhuǎn)換后的文件地址并寫(xiě)入文件中
jsonArray = json.dumps(jsonList)
jsonOpen = open("./data/areaToJson.txt", "w")
jsonOpen.writelines(str(jsonArray))
opens.close()
jsonOpen.close()
所有代碼:
# -*- coding: utf-8 -*-
# !/usr/bin/python3
# desc by: 兩行代碼實(shí)現(xiàn)SQL文件中數(shù)據(jù)提取,后期可以結(jié)合geogle瀏覽器插件應(yīng)用
# author by : rainNight
# weChatPublicNumber: 雨夜的博客
import re
import json
"""
第一步:讀取area.sql文件,去除多余內(nèi)容提取需要添加的數(shù)據(jù)
第二步:定義轉(zhuǎn)換后的文件地址,寫(xiě)入文件
"""
opens = open("./data/area.sql", encoding="utf-8")
codeline = opens.readlines() # 一行一行的讀取
jsonList = []
for line in codeline:
if re.match("INSERT", line):
jsonList.append(re.findall(re.compile(r'[(](.*?)[)]', re.S), line))
jsonArray = json.dumps(jsonList)
jsonOpen = open("./data/areaToJson.txt", "w")
jsonOpen.writelines(str(jsonArray))
opens.close()
jsonOpen.close()
實(shí)現(xiàn)的結(jié)果:
細(xì)微思路的發(fā)現(xiàn)、并將該思維實(shí)現(xiàn)產(chǎn)品中逐漸放大化,最終實(shí)現(xiàn)體系走向產(chǎn)品運(yùn)營(yíng)。
當(dāng)前標(biāo)題:不超過(guò)百行的SQL文件提取器
文章分享:http://m.fisionsoft.com.cn/article/dhghdgo.html


咨詢(xún)
建站咨詢(xún)
