這篇文章主要介紹python如何讀取數(shù)據(jù),文中介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們一定要看完!

利用pandas中的read_csv模塊直接將數(shù)據(jù)讀取出來。
data = pd.read_csv('/home/nw/Desktop/dataset/iris.txt',header = None)上面的代碼,read_csv中前面的是數(shù)據(jù)集存放的路徑,后面的header很重要,經(jīng)常以為少了header,數(shù)據(jù)的總量減小了1,因為少掉的那一行數(shù)據(jù)變成了DataFrame里面的列索引。
還有一種是比較傳統(tǒng)的方法,直接用open打開文件,把文件里面的信息先取出來,不管取出來是什么樣子的,先取出來再說,想要作什么處理直接對取出的變量做處理即可。
f= open('/home/nw/Desktop/dataset/iris.txt','rb')
dataset = pickle.load(f)
#這種方法適用于自己存取自己的數(shù)據(jù),有時候在讀取別人的數(shù)據(jù)的時候是不行的,因為別人存數(shù)據(jù)的方式不一定是用pickle.dump的方
##式存數(shù)據(jù)的。
f = open('/home/nw/Desktop/dataset/iris.txt')
'''
注意這里的open后面最好不要加上其他的讀取方式,不需要‘rb’之類的讀取方式。因為在后續(xù)的數(shù)據(jù)處理中可能還需要將二進(jìn)制的數(shù)
據(jù)轉(zhuǎn)換成自己想要的個數(shù)。
'''
lines = f.readlines()
'''
現(xiàn)在lines中已經(jīng)包含了所有的數(shù)據(jù)信息,我們想要得到的數(shù)據(jù)格式都可以基于lines做處理。如我讀出的iris數(shù)據(jù)格式是一個列表的形
式,使用len(lines)得到列表中元素的個數(shù)是151,打印出lines,可以看到lines中每個元素都是一個字符串,并且每個字符串后面都
有'\n'的換行字符,最后一行是空行,所以最后一行是多余,并且要去掉每行中的'\n'
'''
arr = []
for i in range(len(lines)):
if lines[i] != '\n':
arr.append(lines[i])
for i in range(len(arr)):
arr[i] = arr[i].strip('\n')#將每行的'\n'脫去以上是python如何讀取數(shù)據(jù)的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對大家有幫助,更多相關(guān)知識,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!
名稱欄目:python如何讀取數(shù)據(jù)-創(chuàng)新互聯(lián)
URL鏈接:http://www.chinadenli.net/article4/desgie.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供定制開發(fā)、網(wǎng)站維護(hù)、企業(yè)建站、移動網(wǎng)站建設(shè)、網(wǎng)站內(nèi)鏈、小程序開發(fā)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)