文章詳情頁(yè)

java 較大數(shù)據(jù)量取差集,list.removeAll性能優(yōu)化詳解

瀏覽：44日期：2022-08-23 18:40:13

今天在優(yōu)化項(xiàng)目中的考勤同步功能時(shí)遇到將考勤機(jī)中的數(shù)據(jù)同步到數(shù)據(jù)庫(kù)，

兩邊都是幾萬條數(shù)據(jù)的樣子，老代碼的做法差不多半個(gè)小時(shí)，優(yōu)化后我本機(jī)差不多40秒，服務(wù)器速度會(huì)更加理想。

兩個(gè)數(shù)據(jù)集取差集首先想到的方法便是List.removeAll方法，但是實(shí)驗(yàn)發(fā)現(xiàn)jdk自帶的List.removeAll效率很低

List.removeAll效率低原因：

List.removeAll效率低和list集合本身的特點(diǎn)有關(guān) ：

List底層數(shù)據(jù)結(jié)構(gòu)是數(shù)組,查詢快,增刪慢

1.List.contains()效率沒有hashset高

arrayList.removeAll底層是for循化調(diào)用contains方法。arrayList雖然用get(index)方法查詢效率高，但是若用contains方法查詢對(duì)象元素，Set集合應(yīng)該比List效率要高。

因?yàn)閔ashset的contains方法其實(shí)是先調(diào)用每個(gè)元素的hashCode()方法來返回哈希碼，如果哈希碼的值相等的情況下再調(diào)用equals(obj)方法去判斷是否相等，只有在這兩個(gè)方法所返回的值都相等的情況下，才判定這個(gè)HashSet包含某個(gè)元素，而list直接調(diào)用equals(obj)方法.所以hashset效率更高。

2.arrayList.remove()效率沒有l(wèi)inkedList刪除效率高

arrayList底層采用數(shù)組每刪除一下元素?cái)?shù)據(jù)后面的元素都要往前移動(dòng)效率低消耗的資源也大，linkedList鏈表刪除元素只要改變前后節(jié)點(diǎn)的位置信息

3.采用Iterator迭代器，這種方式我們僅需要對(duì)iterator進(jìn)行循環(huán)，然后對(duì)需要?jiǎng)h除的元素執(zhí)行iterator.remove(iterator.next()),而無需關(guān)注下標(biāo)的問題

改進(jìn)代碼

LinkedList linkedList= new LinkedList(src);//大集合用linkedlistHashSet hashSet= new HashSet(oth);//小集合用hashsetIterator iter = linkedList.iterator();//采用Iterator迭代器進(jìn)行數(shù)據(jù)的操作while(iter.hasNext()){if(hashSet.contains(iter.next())){iter.remove();}}

補(bǔ)充知識(shí)：JAVA獲取兩個(gè)數(shù)據(jù)量較大的ArrayList的交集、差集以及并集

測(cè)試說明：獲取firstArrayList和secondArrayList的交集、差集以及并集。實(shí)際測(cè)試中firstArrayList數(shù)據(jù)量190000，secondArrayList數(shù)據(jù)量170000.效率比較高。此處只列出少量數(shù)據(jù)。測(cè)試代碼如下：

import java.util.Set;import java.util.List;import java.util.HashSet;import java.util.TreeSet;import java.util.Iterator;import java.util.ArrayList;import java.util.LinkedList;public class getSet { public static void main(String args[]) { getList(); } // 獲取兩個(gè)ArrayList的差集、交集、去重并集(數(shù)據(jù)量大小不限制) private static void getList() { List<String> firstArrayList = new ArrayList<String>(); List<String> secondArrayList = new ArrayList<String>(); List<String> defectList = new ArrayList<String>();//差集List List<String> collectionList = new ArrayList<String>();//交集List List<String> unionList = new ArrayList<String>();//去重并集List try { firstArrayList.add('aaa'); firstArrayList.add('bbb'); firstArrayList.add('ccc'); firstArrayList.add('ddd'); secondArrayList.add('bbb'); secondArrayList.add('ccc'); secondArrayList.add('eee'); // 獲取差集 defectList = receiveDefectList(firstArrayList, secondArrayList); Iterator<String> defectIterator = defectList.iterator(); System.out.println('===================差集==================='); while(defectIterator.hasNext()) { System.out.println(defectIterator.next()); } // 獲取交集 collectionList = receiveCollectionList(firstArrayList, secondArrayList); Iterator<String> collectionIterator = collectionList.iterator(); System.out.println('===================交集==================='); while(collectionIterator.hasNext()) { System.out.println(collectionIterator.next()); } // 獲取去重并集 unionList = receiveUnionList(firstArrayList, secondArrayList); Iterator<String> unionIterator = unionList.iterator(); System.out.println('===================去重并集==================='); while(unionIterator.hasNext()) { System.out.println(unionIterator.next()); } }catch(Exception e) { e.printStackTrace(); } } /** * @方法描述：獲取兩個(gè)ArrayList的差集 * @param firstArrayList 第一個(gè)ArrayList * @param secondArrayList 第二個(gè)ArrayList * @return resultList 差集ArrayList */ public static List<String> receiveDefectList(List<String> firstArrayList, List<String> secondArrayList) { List<String> resultList = new ArrayList<String>(); LinkedList<String> result = new LinkedList<String>(firstArrayList);// 大集合用linkedlist HashSet<String> othHash = new HashSet<String>(secondArrayList);// 小集合用hashset Iterator<String> iter = result.iterator();// 采用Iterator迭代器進(jìn)行數(shù)據(jù)的操作 while(iter.hasNext()){ if(othHash.contains(iter.next())){ iter.remove(); } } resultList = new ArrayList<String>(result); return resultList; } /** * @方法描述：獲取兩個(gè)ArrayList的交集 * @param firstArrayList 第一個(gè)ArrayList * @param secondArrayList 第二個(gè)ArrayList * @return resultList 交集ArrayList */ public static List<String> receiveCollectionList(List<String> firstArrayList, List<String> secondArrayList) { List<String> resultList = new ArrayList<String>(); LinkedList<String> result = new LinkedList<String>(firstArrayList);// 大集合用linkedlist HashSet<String> othHash = new HashSet<String>(secondArrayList);// 小集合用hashset Iterator<String> iter = result.iterator();// 采用Iterator迭代器進(jìn)行數(shù)據(jù)的操作 while(iter.hasNext()) { if(!othHash.contains(iter.next())) { iter.remove(); } } resultList = new ArrayList<String>(result); return resultList; } /** * @方法描述：獲取兩個(gè)ArrayList的去重并集 * @param firstArrayList 第一個(gè)ArrayList * @param secondArrayList 第二個(gè)ArrayList * @return resultList 去重并集ArrayList */ public static List<String> receiveUnionList(List<String> firstArrayList, List<String> secondArrayList) { List<String> resultList = new ArrayList<String>(); Set<String> firstSet = new TreeSet<String>(firstArrayList); for(String id : secondArrayList) { // 當(dāng)添加不成功的時(shí)候說明firstSet中已經(jīng)存在該對(duì)象 firstSet.add(id); } resultList = new ArrayList<String>(dawjidSet); return resultList; }}

打印結(jié)果：

===================差集===================aaaddd===================交集===================bbbccc=================去重并集==================aaabbbcccdddeee

說明，取差集指的是取firstArrayList中存在但secondArrayList中不存在的數(shù)據(jù)集

以上這篇java 較大數(shù)據(jù)量取差集,list.removeAll性能優(yōu)化詳解就是小編分享給大家的全部?jī)?nèi)容了，希望能給大家一個(gè)參考，也希望大家多多支持好吧啦網(wǎng)。

Java

上一條：idea插件篇之java內(nèi)存分析工具(JProfiler)的使用下一條：Java 獲取兩個(gè)List的交集和差集,以及應(yīng)用場(chǎng)景操作

排行榜

					
					Java 生成帶Logo和文字的二維碼
SSM框架整合之Spring+SpringMVC+MyBatis實(shí)踐步驟
詳解Java執(zhí)行g(shù)roovy腳本的兩種方式
Python word文本自動(dòng)化操作實(shí)現(xiàn)方法解析
ant design vue datepicker日期選擇器中文化操作
詳解如何實(shí)現(xiàn)phpoffice的excel導(dǎo)入功能解耦
vue異步更新dom的實(shí)現(xiàn)淺析
前后端ajax和json數(shù)據(jù)交換方式
Android 使用騰訊X5瀏覽器上傳圖片的示例
Windows Phone 支持 Android 應(yīng)用程序？來看看第三方開發(fā)者怎么說
詳解PHP實(shí)現(xiàn)HTTP服務(wù)器過程