最近在學習機器學習的相關算法,寫到DbScan算法發現在簇擴展時用到兩個鄰域中的點會重合,于是嘗試了合并兩個鏈表的兩個算法。
最初用到這個方法,認為它簡單易用。思路是定義一個鏈表存放合并后的鏈表list,首先往該鏈表中加入a鏈表,再去掉b鏈表,這樣list中就剩下只有a鏈表有而b鏈表沒有的節點,最后加上b鏈表,就不會存在重復元素。
設aList[a,b,c,d,e]bList[b,c,d,f]
public ArrayList<PointTest> expandCluster(ArrayList<PointTest> aList,ArrayList<PointTest> bList) {ArrayList<PointTest> list = new ArrayList<PointTest>();list.addAll(aList);list.removeAll(bList);list.addAll(bList);return list;}
驗證算法過程中發現上述方法合并后得到的鏈表為list[a,e,b,c,d,f],而我在DbScan中想要的效果是list[a,b,c,d,e,f],于是改變了一下思路,如下:
public ArrayList<PointTest> expandCluster(ArrayList<PointTest> aList,ArrayList<PointTest> bList) {for (int i = 0; i < bList.size(); i++) {if (aList.contains(bList.get(i)))bList.remove(i);}aList.addAll(bList);return aList;}