脚本之家,脚本语言编程技术及教程分享平台!
分类导航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服务器之家 - 脚本之家 - Python - Python取读csv文件做dbscan分析

Python取读csv文件做dbscan分析

2022-11-28 10:10空中旋转篮球 Python

这篇文章主要介绍了Python取读csv文件做dbscan分析,读取csv文件中相应的列,然后进行转化,处理为本算法需要的格式,然后进行dbscan运算,下面文章的具体介绍需要的小伙伴可以参考一下

1.读取csv数据做dbscan分析

读取csv文件中相应的列,然后进行转化,处理为本算法需要的格式,然后进行dbscan运算,目前公开的代码也比较多,本文根据公开代码修改,

具体代码如下:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
from sklearn import datasets
import numpy as np
import random
import matplotlib.pyplot as plt
import time
import copy
import pandas as pd
# from sklearn.datasets import load_iris
 
def find_neighbor(j, x, eps):
    N = list()
    for i in range(x.shape[0]):
        temp = np.sqrt(np.sum(np.square(x[j] - x[i])))  # 计算欧式距离
        if temp <= eps:
            N.append(i)
    return set(N)
 
 
def DBSCAN(X, eps, min_Pts):
    k = -1
    neighbor_list = []  # 用来保存每个数据的邻域
    omega_list = []  # 核心对象集合
    gama = set([x for x in range(len(X))])  # 初始时将所有点标记为未访问
    cluster = [-1 for _ in range(len(X))]  # 聚类
    for i in range(len(X)):
        neighbor_list.append(find_neighbor(i, X, eps))
        if len(neighbor_list[-1]) >= min_Pts:
            omega_list.append(i)  # 将样本加入核心对象集合
    omega_list = set(omega_list)  # 转化为集合便于操作
    while len(omega_list) > 0:
        gama_old = copy.deepcopy(gama)
        j = random.choice(list(omega_list))  # 随机选取一个核心对象
        k = k + 1
        Q = list()
        Q.append(j)
        gama.remove(j)
        while len(Q) > 0:
            q = Q[0]
            Q.remove(q)
            if len(neighbor_list[q]) >= min_Pts:
                delta = neighbor_list[q] & gama
                deltalist = list(delta)
                for i in range(len(delta)):
                    Q.append(deltalist[i])
                    gama = gama - delta
        Ck = gama_old - gama
        Cklist = list(Ck)
        for i in range(len(Ck)):
            cluster[Cklist[i]] = k
        omega_list = omega_list - Ck
    return cluster
 
# X = load_iris().data
data = pd.read_csv("testdata.csv")
x,y=data['Time (sec)'],data['Height (m HAE)']
print(type(x))
n=len(x)
x=np.array(x)
x=x.reshape(n,1)
y=np.array(y)
y=y.reshape(n,1)
X = np.hstack((x, y))
cluster_std=[[.1]], random_state=9)
 
eps = 0.08
min_Pts = 5
begin = time.time()
C = DBSCAN(X, eps, min_Pts)
end = time.time()
plt.figure()
plt.scatter(X[:, 0], X[:, 1], c=C)
plt.show()

2.输出结果显示

Python取读csv文件做dbscan分析

修改参数显示:

?
1
2
eps = 0.8
min_Pts = 5

Python取读csv文件做dbscan分析

Python取读csv文件做dbscan分析

3.计算效率

采用少量数据计算的时候效率问题不明显,随着数据量增大,计算效率问题就变得尤为明显,难以满足大量数据的计算需求了,后期将想办法优化计算方法或者收集C++代码进行优化了。

到此这篇关于Python取读csv文件做dbscan分析的文章就介绍到这了,更多相关Python  dbscan分析内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家!

原文链接:https://blog.csdn.net/soderayer/article/details/124089170

延伸 · 阅读

精彩推荐
  • PythonPython执行时间的计算方法小结

    Python执行时间的计算方法小结

    这篇文章主要介绍了Python执行时间的计算方法小结的相关资料,需要的朋友可以参考下...

    wangshuang16315032020-09-24
  • PythonPython的线程使用队列Queue来改造转账场景

    Python的线程使用队列Queue来改造转账场景

    前篇我们了队列Queue和转账场景这次趁热学委展示一下使用队列解决转账场景的问题,这篇文章主要介绍了Python的线程使用队列来改造转账场景,需要的朋友...

    雷学委4322022-10-13
  • PythonPython利用Beautiful Soup模块创建对象详解

    Python利用Beautiful Soup模块创建对象详解

    这篇文章主要介绍了Python利用Beautiful Soup模块创建对象的相关资料,文中介绍的非常详细,相信对大家具有一定的参考价值,需要的朋友们下面来一起看看...

    Glumes6962020-09-27
  • Pythonpython中torch.nn.identity()方法详解

    python中torch.nn.identity()方法详解

    今天看源码时遇到的这个恒等函数,就如同名字那样占位符,并没有实际操作,下面这篇文章主要给大家介绍了关于python中torch.nn.identity()方法的相关资料,需要...

    sigmoidAndRELU8622022-11-13
  • PythonPython集合的基础操作

    Python集合的基础操作

    这篇文章主要介绍了Python集合的基础操作,Python中的集合和数学上的集合基本是没有区别的,是无序的,即不可以使用索引访问的,集合中是不能出现重复...

    一碗周6572022-02-22
  • PythonPytorch使用技巧之Dataloader中的collate_fn参数详析

    Pytorch使用技巧之Dataloader中的collate_fn参数详析

    collate_fn 参数的目的主要是为了随心所欲的转变数据的类型,这个数据是用DataLoader加载的,比如img,target,下面这篇文章主要给大家介绍了关于Pytorch使用技巧之...

    政在学习9442022-11-04
  • Python基于python的图片修复程序(实现水印去除)

    基于python的图片修复程序(实现水印去除)

    这篇文章主要给大家介绍了关于python图片修复程序的相关资料,可以用于实现图片中水印去除,主要利用的是OpenCV这个框架实现的,文中通过示例代码介绍...

    王磊的博客5182021-02-28
  • Python教你学会通过python的matplotlib库绘图

    教你学会通过python的matplotlib库绘图

    今天教大家如何学会通过python的matplotlib库绘图,文中有非常详细的图文解说及代码示例,对正在学习python的小伙伴们很有帮助,需要的朋友可以参考下...

    qq_4365042112452021-11-11