脚本之家,脚本语言编程技术及教程分享平台!
分类导航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服务器之家 - 脚本之家 - Python - 用python爬取中国大学排名网站排名信息

用python爬取中国大学排名网站排名信息

2022-09-05 11:19海岛码农 Python

大家好,本篇文章主要讲的是用python爬取中国大学排名网站排名信息,感兴趣的同学赶快来看一看吧,对你有帮助的话记得收藏一下

 程序解决问题如下:

利用python网络爬虫爬取中国大学排名网站上的排名信息,将排名前20的大学的信息保存为文本文件,并在窗口打印出这20所大学的信息,按列打印和保存。

程序代码如下:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
import requests
from bs4 import BeautifulSoup
import bs4
 
def getHTMLText(url):
    try:
        r = requests.get(url, timeout=30)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return ""
 
def fillUnivList(ulist, html):
    soup = BeautifulSoup(html, "html.parser")
    for tr in soup.find('tbody').children:
        if isinstance(tr, bs4.element.Tag):
            tds = tr('td')
            hdfd = tds[0].find('div')
            tt = hdfd.string.split()
            ff = "".join(tt)
            attr = tds[1].find('a')
            hh = tds[4].string.split()
            hg = "".join(hh)
            shf=tds[2].text.split()
            shfn="".join(shf)
            ulist.append([ff, attr.string,shfn,hg])
 
 
def printUnivList(ulist, num):
    tplt = "{0:^10}\t{1:{4}^10}\t{2:^10}\t{3:^10}"
    print(tplt.format("排名","学校名称","省份","总分", chr(12288)))
    with open('save.txt', 'w+', encoding='utf-8') as f:
        f.write(tplt.format("排名","学校名称","省份","总分", chr(12288)))
        f.write('\n')
    for i in range(num):
        u = ulist[i]
        print(tplt.format(u[0], u[1], u[2],u[3],chr(12288)))
        with open('save.txt', 'a', encoding='utf-8') as f:
            f.write(tplt.format(u[0], u[1], u[2],u[3],chr(12288)))
            f.write('\n')
 
def main():
    with open('save.txt', 'w+', encoding='utf-8') as f:
        f.write("排名,学校,省份,总分\n")
        f.close()
    uinfo = []
    url = 'https://www.shanghairanking.cn/rankings/bcur/2021'
    html = getHTMLText(url)
    fillUnivList(uinfo, html)
    printUnivList(uinfo, 20)
main()

程序运行结果如下:

用python爬取中国大学排名网站排名信息

用python爬取中国大学排名网站排名信息

到此这篇关于用python爬取中国大学排名网站排名信息的文章就介绍到这了,更多相关python爬取中国大学排名信息内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家!

原文链接:https://blog.csdn.net/qq_59049513/article/details/122673288

延伸 · 阅读

精彩推荐
  • PythonPandas中Apply函数加速百倍的技巧分享

    Pandas中Apply函数加速百倍的技巧分享

    虽然目前dask,cudf等包的出现,使得我们的数据处理大大得到了加速,但是并不是每个人都有比较好的gpu。本文为大家分享几个Pandas中Apply函数加速百倍的技...

    程序员小八3672022-07-29
  • Pythonpython距离测量的方法

    python距离测量的方法

    这篇文章主要为大家详细介绍了python距离测量的方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下...

    咻_python4342021-01-19
  • PythonPython中flatten( )函数及函数用法详解

    Python中flatten( )函数及函数用法详解

    flatten是numpy.ndarray.flatten的一个函数,即返回一个一维数组。这篇文章主要介绍了Python中flatten( )函数,需要的朋友可以参考下...

    perfect_young13982021-04-15
  • Python在python中画正态分布图像的实例

    在python中画正态分布图像的实例

    今天小编就为大家分享一篇在python中画正态分布图像的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...

    bitcarmanlee6492021-08-04
  • Python利用Python破解斗地主残局详解

    利用Python破解斗地主残局详解

    斗地主应该对大家来说都不陌生,下面这篇文章主要跟大家分享了关于利用Python破解斗地主残局的相关资料,文中介绍的非常详细,对大家具有一定的参考...

    Tim3562020-11-22
  • Python将pip源更换到国内镜像的详细步骤

    将pip源更换到国内镜像的详细步骤

    这篇文章主要介绍了将pip源更换到国内镜像的详细步骤,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧...

    Chaser_LittleBee11322021-06-13
  • PythonPython urls.py的三种配置写法实例详解

    Python urls.py的三种配置写法实例详解

    这篇文章主要介绍了Python urls.py的三种配置写法实例详解的相关资料,需要的朋友可以参考下...

    academy8422020-10-05
  • PythonUbuntu下安装PyV8

    Ubuntu下安装PyV8

    本文给大家简单介绍了下在ubuntu下安装pyv8的方法和注意事项,非常的实用,有需要的小伙伴可以参考下...

    脚本之家2112020-08-16