脚本之家,脚本语言编程技术及教程分享平台!
分类导航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服务器之家 - 脚本之家 - Python - Python利用正则表达式从字符串提取数字

Python利用正则表达式从字符串提取数字

2022-09-09 11:06Buer_zhu Python

正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配,下面这篇文章主要给大家介绍了关于Python利用正则表达式从字符串提取数字的相关资料,需要的朋友可以参考下

前言

正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。

Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。

re 模块使 Python 语言拥有全部的正则表达式功能。

利用正则表达式从字符串提取数字

主要用到下面几个函数

(1)compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。

语法格式为:

re.compile(pattern[, flags])

参数:

  • pattern : 一个字符串形式的正则表达式
  • flags 可选,表示匹配模式,比如忽略大小写,多行模式等,具体参数为:
  • re.I 忽略大小写
  • re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依赖于当前环境
  • re.M 多行模式
  • re.S 即为' . '并且包括换行符在内的任意字符(' . '不包括换行符)
  • re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依赖于 Unicode 字符属性数据库
  • re.X 为了增加可读性,忽略空格和' # '后面的注释

(2)re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。

函数语法:

re.match(pattern, string, flags=0)

(3)re.search 扫描整个字符串并返回第一个成功的匹配。

函数语法:

re.search(pattern, string, flags=0)

注:

re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配。

(4)findall

在字符串中找到正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表。

注意: match 和 search 是匹配一次 findall 匹配所有。

语法格式为:

findall(string[, pos[, endpos]])

参数:

string 待匹配的字符串。
pos 可选参数,指定字符串的起始位置,默认为 0。
endpos 可选参数,指定字符串的结束位置,默认为字符串的长度。

下面是实现的具体方法:

?
1
2
3
4
5
6
7
8
def findnum(string):
    comp=re.compile(-?[1-9]\d*)
    list_str=comp.findall(string)
    list_num=[]
    for item in list_str:
        item=int(item)
        list_num.append(item)
    return list_num

re.compile()的一些匹配参数:

  • [1-9]\d*      正整数
  • -[1-9]\d*   负整数
  • -?[1-9]\d* 整数
  • [1-9]\d*|0  非负整数
  • -[1-9]\d*|0   非正整数
  • [1-9]\d*\.\d*|0\.\d*[1-9]\d*$   正浮点数
  • -([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$  负浮点数
  • -?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$  浮点数

附python正则表达式抽取文本中的时间日期

使用python的正则表达式抽取文本中的年月日信息,如2020年5月19日。

?
1
2
3
4
5
6
7
8
9
def find_time(yanbao_txt, entity):
    paras = [para.strip() for para in yanbao_txt.split('\n') if para.strip()][:5]
    for para in paras:
        ret = re.findall(r'(\d{4})\s*[\./年-]\s*(\d{1,2})\s*[\./月-]\s*(\d{1,2})\s*日?', para)
        if ret:
            year, month, day = ret[0]
            time = '{}/{}/{}'.format(year, month.lstrip(), day.lstrip())
            return time
    return None

总结

到此这篇关于Python利用正则表达式从字符串提取数字的文章就介绍到这了,更多相关Python正则字符串提取数字内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家!

原文链接:https://blog.csdn.net/Buer_zhu/article/details/79636619

延伸 · 阅读

精彩推荐
  • PythonPytorch 中retain_graph的用法详解

    Pytorch 中retain_graph的用法详解

    今天小编就为大家分享一篇Pytorch 中retain_graph的用法详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧 ...

    DaneAI10002020-05-06
  • PythonOpenCV半小时掌握基本操作之色彩空间

    OpenCV半小时掌握基本操作之色彩空间

    这篇文章主要介绍了OpenCV基本操作之色彩空间,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下...

    我是小白呀5872021-12-28
  • Python使用Python webdriver图书馆抢座自动预约的正确方法

    使用Python webdriver图书馆抢座自动预约的正确方法

    这篇文章主要介绍了使用Python webdriver图书馆抢座自动预约的正确方法,本文通过图文实例相结合给大家介绍的非常详细,对大家的学习或工作具有一定的参...

    黄湘杰6932021-09-14
  • Python使用python编写监听端

    使用python编写监听端

    这篇文章主要为大家详细介绍了使用python编写监听端,具有一定的参考价值,感兴趣的小伙伴们可以参考一下...

    pingd9352021-01-30
  • PythonPython实现决策树C4.5算法的示例

    Python实现决策树C4.5算法的示例

    本篇文章主要介绍了Python实现决策树C4.5算法的示例,详解的介绍了决策树C4.5算法的原理和实现代码,非常具有实用价值,需要的朋友可以参考下...

    WOTGL8782021-02-27
  • PythonPython用二分法求平方根的案例

    Python用二分法求平方根的案例

    这篇文章主要介绍了Python用二分法求平方根的案例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...

    sharkandshark10942021-09-18
  • Python简单的抓取淘宝图片的Python爬虫

    简单的抓取淘宝图片的Python爬虫

    这篇文章主要介绍了简单的抓取淘宝图片的Python爬虫,方法比较简单,推荐给小伙伴们参考下。 ...

    脚本之家12522020-05-17
  • Python手把手教你使用Python打造一款摸鱼倒计时界面

    手把手教你使用Python打造一款摸鱼倒计时界面

    前段时间在微博看到一段摸鱼人的倒计时模板,感觉还挺有趣的。于是我用了一小时的时间写了个页面出来 摸鱼办地址 (当然是摸鱼的时间啦)。...

    Python爬虫与数据挖掘6142021-12-30