python excel多行合并的方法
一、概述現(xiàn)有一個(gè)wenda1.xlsx文件,內(nèi)容如下:
需要將faq記錄合并為一行,效果如下:
注意:faq記錄,每一行用||來拼接。
二、多行轉(zhuǎn)換一行新建test1.py,內(nèi)容如下:
# !/usr/bin/python3# -*- coding: utf-8 -*-import xlrd# 打開excel文件,創(chuàng)建一個(gè)workbook對(duì)象rbook = xlrd.open_workbook(’wenda1.xlsx’)# sheets方法返回對(duì)象列表,[<xlrd.sheet.Sheet object at 0x103f147f0>]rbook.sheets()# xls默認(rèn)有3個(gè)工作簿,Sheet1,Sheet2,Sheet3rsheet = rbook.sheet_by_index(0) # 取第一個(gè)工作簿faq_tmp_dict = {} # FAQ臨時(shí)字典faq_formal_list = [] # FAQ正式列表first_category_tag = '' # 一級(jí)分類標(biāo)識(shí)index = 0 # 索引#循環(huán)工作簿的所有行for row in rsheet.get_rows(): index +=1 first_category_row = row[0] # 1級(jí)分類所在的列 first_category_value = first_category_row.value # 1級(jí)分類的值 if first_category_value != ’1級(jí)分類’: # 排除第一行,這些都是列名 if first_category_value: # 當(dāng)1級(jí)分類的值不為空時(shí) # 更新一級(jí)分類標(biāo)識(shí),用#連接 first_category_tag = '%s#%s'%(first_category_value,index) faq_like_column = row[1] # FAQ相似句所在的列 faq_like_value = faq_like_column.value # FAQ相似句的值 # 更新臨時(shí)字典,不存在默認(rèn)值為空字典,否則追加到列表中 faq_tmp_dict.setdefault(first_category_tag, []).append(faq_like_value) else: # 當(dāng)1級(jí)分類的值為空時(shí) faq_like_column = row[1] # FAQ相似句所在的列 faq_like_value = faq_like_column.value faq_tmp_dict.setdefault(first_category_tag, []).append(faq_like_value)print(faq_tmp_dict)# 處理臨時(shí)字典for i in faq_tmp_dict: tmp_dict = {} # 一級(jí)分類,切割#號(hào),取第一個(gè) first_category = i.split(’#’)[0] # print('first_category',first_category) # faq所有記錄,將faq列表轉(zhuǎn)換為一行,用逗號(hào)拼接 faq_like_all = '||'.join(faq_tmp_dict[i]) # print('faq_merge',faq_all) tmp_dict[’first_category’] = first_category tmp_dict[’faq_like_all’] = faq_like_all faq_formal_list.append(tmp_dict)print(faq_formal_list)
執(zhí)行輸出:
{’閑聊#2’: [’不在嗎?’, ’你好在嗎?’, ’你在不在’, ’有人在么。’, ’你好?’, ’在么?說話啊’, ’客戶在不在?’], ’閑聊#9’: [’你好’, ’客服你好’, ’你好,客服’]}[{’first_category’: ’閑聊’, ’faq_like_all’: ’不在嗎?||你好在嗎?||你在不在||有人在么。||你好?||在么?說話啊||客戶在不在?’}, {’first_category’: ’閑聊’, ’faq_like_all’: ’你好||客服你好||你好,客服’}]
從上面輸出內(nèi)容,可以看出。將多行合并為一行,并且將faq記錄寫入到一個(gè)字典里面了。接下來就可以寫入到新表格了。
三、寫入新表格完整代碼如下:
# !/usr/bin/python3# -*- coding: utf-8 -*-import xlrd# 打開excel文件,創(chuàng)建一個(gè)workbook對(duì)象rbook = xlrd.open_workbook(’wenda1.xlsx’)# sheets方法返回對(duì)象列表,[<xlrd.sheet.Sheet object at 0x103f147f0>]rbook.sheets()# xls默認(rèn)有3個(gè)工作簿,Sheet1,Sheet2,Sheet3rsheet = rbook.sheet_by_index(0) # 取第一個(gè)工作簿faq_tmp_dict = {} # FAQ臨時(shí)字典faq_formal_list = [] # FAQ正式列表first_category_tag = '' # 一級(jí)分類標(biāo)識(shí)index = 0 # 索引#循環(huán)工作簿的所有行for row in rsheet.get_rows(): index +=1 first_category_row = row[0] # 1級(jí)分類所在的列 first_category_value = first_category_row.value # 1級(jí)分類的值 if first_category_value != ’1級(jí)分類’: # 排除第一行,這些都是列名 if first_category_value: # 當(dāng)1級(jí)分類的值不為空時(shí) # 更新一級(jí)分類標(biāo)識(shí),用#連接 first_category_tag = '%s#%s'%(first_category_value,index) faq_like_column = row[1] # FAQ相似句所在的列 faq_like_value = faq_like_column.value # FAQ相似句的值 # 更新臨時(shí)字典,不存在默認(rèn)值為空字典,否則追加到列表中 faq_tmp_dict.setdefault(first_category_tag, []).append(faq_like_value) else: # 當(dāng)1級(jí)分類的值為空時(shí) faq_like_column = row[1] # FAQ相似句所在的列 faq_like_value = faq_like_column.value faq_tmp_dict.setdefault(first_category_tag, []).append(faq_like_value)print(faq_tmp_dict)# 處理臨時(shí)字典for i in faq_tmp_dict: tmp_dict = {} # 一級(jí)分類,切割#號(hào),取第一個(gè) first_category = i.split(’#’)[0] # print('first_category',first_category) # faq所有記錄,將faq列表轉(zhuǎn)換為一行,用逗號(hào)拼接 faq_like_all = '||'.join(faq_tmp_dict[i]) # print('faq_merge',faq_all) tmp_dict[’first_category’] = first_category tmp_dict[’faq_like_all’] = faq_like_all faq_formal_list.append(tmp_dict)print(faq_formal_list)import xlwtimport jsonf = xlwt.Workbook()sheet1 = f.add_sheet(’Sheet1’, cell_overwrite_ok=True)row0 = ['1級(jí)分類', 'faq記錄']# 寫第一行for i in range(0, len(row0)): sheet1.write(0, i, row0[i])# # 加載json文件# with open('tj.json', ’r’) as load_f:# load_dict = json.load(load_f) # 反序列化文件#num = 0 # 計(jì)數(shù)器max_length = 0 # 最大長度for i in faq_formal_list: num+=1 # 自增1 faq_col = sheet1.col(1) # faq記錄所在的列 length = len(i[’faq_like_all’]) # 計(jì)算長度 # print('長度',length) # 更新最大長度 if max_length < length: max_length = length # 設(shè)置表格寬度 faq_col.width = max_length * 20* 20 # 寫入庫名 sheet1.write(num, 0, i[’first_category’]) # faq_like_str = '||'.join(i[’faq_like_all’]) sheet1.write(num, 1, i[’faq_like_all’])# 保存到表格f.save(’test1.xls’)
執(zhí)行代碼,它會(huì)生成一個(gè)test1.xlsx。
打開文件,效果如下:
以上就是python excel多行合并的方法的詳細(xì)內(nèi)容,更多關(guān)于python excel多行合并的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章!
相關(guān)文章:
1. ThinkPHP5實(shí)現(xiàn)JWT Token認(rèn)證的過程(親測(cè)可用)2. Xml簡(jiǎn)介_動(dòng)力節(jié)點(diǎn)Java學(xué)院整理3. IntelliJ IDEA設(shè)置自動(dòng)提示功能快捷鍵的方法4. 最新Android & iOS設(shè)計(jì)尺寸規(guī)范5. layui的checbox在Ajax局部刷新下的設(shè)置方法6. Django 自定義404 500等錯(cuò)誤頁面的實(shí)現(xiàn)7. PHP結(jié)構(gòu)型模式之裝飾器模式8. python實(shí)現(xiàn)圖像處理之PiL依賴庫的案例應(yīng)用詳解9. Pytest中skip skipif跳過用例詳解10. 淺析Python實(shí)現(xiàn)DFA算法
