`
nmv884rp
  • 浏览: 24885 次
最近访客 更多访客>>
社区版块
存档分类
最新评论

笔记-正则表达式的2种引擎

阅读更多

  正则表达式的引擎分为2种,一种是DFA引擎,一种是NFA引擎。
  DFA引擎是文本主导的,对于要匹配的文本,记录2个pointer,一个是文本当前匹配的位置,另一个记录正则表达式中的匹配位置,这可能有好几个位置
  NFA引擎是正则表达式主导的,也记录2个pointer,一个是文本当前匹配的位置,另一个记录正则表达式中的匹配位置,这只有一个。当当前路径无法匹配时,通过保存的备份记录和回溯来继续进行匹配
  优劣:
  1,DFA引擎需要的编译时间比NFA长
  2。DFA引擎运行的时间比NFA短,对于每个文本,DFA只需要匹配一次,没有回溯
  3。NFA提供更多可以控制的结构,比如,环视,固化分组,忽略优先,获取匹配的文本等,匹配同样文本的NFA正则表示式运行效率有很大差别,但是匹配同样文本的DFA正则表达式则差别不大。
分享到:
评论

相关推荐

    python源码笔记实战 物超所值

    10-正则表达式 11-Git 12-电子词典 13-HTMLCSS第一部分 14-HTML&CSS第二部分 15-前端项目 16- flask 17- Ajax 18-博客项目 19-Django 20-天天果园项目 21-爬虫基础 22-爬虫高级 23-Numpy基础,数据分析 24-机器学习...

    Python 笔记源码【笔记+教程+示例源码】.zip

    10-正则表达式 17- Ajax 05-面向对象 02-Python基础第一部分 09-MongoDB数据库 04-Python基础第三部分 03-Python基础第=二部分 30-.人脸识别 27-支持向量机,聚类 28-推荐引擎,自然语言 26-朴素贝叶斯分类 29-语言...

    Python笔记源码.zip

    10-正则表达式 11-Git 13-HTML&CSS 15-前端项目 21-爬虫 23-Numpy基础,数据分析 24-机器学习介绍 25-决策树 26-朴素贝叶斯分类 27-支持向量机,聚类 28-推荐引擎,自然语言 29-语言识别。图像识别 30-人脸识别

    程序员面试刷题的书哪个好-my-notes::books:我的个人笔记库

    :一个正则表达式助手。 : Booru 抓取器。 :GTK2 图像查看器、漫画阅读器和 booru 浏览器。 :Spotify CSS 注入器。 :用于解释性数学视频的 Python 动画引擎。 :Python CLI 到 GUI。 :一个 HTTP 基准测试工具。 ...

    python3网络爬虫笔记与实战源码.zip

    常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标数据,如文本、图片、链接等。 数据存储: 爬虫将提取的数据存储到数据库、文件或其他存储介质中,以备后续分析或展示。常用...

    learn-series:记录自己学习各种技术的总结笔记和代码

    正则表达式学习总结 git深度使用总结 后面计划添加的学习笔记有: Flutter知识总结 搭建个人博客总结 vue-router 源码研究 vue 源码研究 vuex 源码研究 vite 源码研究 编译技术知识总结 前端图形相关知识总结(svg/...

    Python 网络爬虫(Web Crawlers)学习笔记。.zip

    常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标数据,如文本、图片、链接等。 数据存储: 爬虫将提取的数据存储到数据库、文件或其他存储介质中,以备后续分析或展示。常用...

    平时学习爬虫的一些代码笔记以及案例实战.zip

    常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标数据,如文本、图片、链接等。 数据存储: 爬虫将提取的数据存储到数据库、文件或其他存储介质中,以备后续分析或展示。常用...

    小红书关键词笔记搜索Python 爬虫 (csv保存).zip

    常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标数据,如文本、图片、链接等。 数据存储: 爬虫将提取的数据存储到数据库、文件或其他存储介质中,以备后续分析或展示。常用...

    小红书爬虫,小红书笔记、主页、搜索爬取.zip

    常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标数据,如文本、图片、链接等。 数据存储: 爬虫将提取的数据存储到数据库、文件或其他存储介质中,以备后续分析或展示。常用...

    路飞学城爬虫开发+APP逆向超级大神班学习笔记.zip

    常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标数据,如文本、图片、链接等。 数据存储: 爬虫将提取的数据存储到数据库、文件或其他存储介质中,以备后续分析或展示。常用...

    JavaNotes:自学,存放学习笔记

    正则表达式 重新组织函数 JavaWeb HTML,CSS JavaScript jQuery查询 Servelet JSON格式 阿贾克斯 RESTful的 单点登录 VUE CDN 搜索引擎优化 XSS CSRF 会议 曲奇饼 过滤器 监听器 IO 蔚来 净额 非双向IO和...

    python爬虫仓库,包括一些学习笔记,例如基础、简单的画图词云数据分析。主要还是爬虫.zip

    常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标数据,如文本、图片、链接等。 数据存储: 爬虫将提取的数据存储到数据库、文件或其他存储介质中,以备后续分析或展示。常用...

    python爬虫的学习和代码模板的笔记记录。涉及文本数据、图片数据、音频数据、视频数据的抓取。.zip

    常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标数据,如文本、图片、链接等。 数据存储: 爬虫将提取的数据存储到数据库、文件或其他存储介质中,以备后续分析或展示。常用...

    读书笔记《自己动手写网络爬虫》,自己敲的代码。主要记录了网络爬虫的基本实现,网页去重的算法,网页指纹算法,文本信息挖掘.zip

    常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标数据,如文本、图片、链接等。 数据存储: 爬虫将提取的数据存储到数据库、文件或其他存储介质中,以备后续分析或展示。常用...

    深入java虚拟机源码-books-recommendation:后端进阶经典图书

    深入java虚拟机 源码 Catalog 奔跑吧 ANSIBLE 分布式服务架构....大型网站技术架构:核心原理与案例分析 ...精通正则表达式_中文版 Roy_Thomas_Fielding博士论文REST(中文版) 图解TCPIP TCP-IP详解 从PAXOS到ZOOKEEP

    京东商品评论爬虫 苏宁商品评论爬虫.zip

    常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标数据,如文本、图片、链接等。 数据存储: 爬虫将提取的数据存储到数据库、文件或其他存储介质中,以备后续分析或展示。常用...

    jive.chm

    2 Jive中的分页处理 3 Jive中Jdom使用剖析 4 丰富的图释 5 使用正则表达式让你的jive显示图片 6 Jive3增加帖子的点击功能的高效方法 <br> 国际化支持 1 jive_forums_i18n_zh_...

    Jive资料集

    6 全面了解Jive中的ID机制 <br> 扩展功能 1 为jive3.x写ColorFilter 2 Jive中的分页处理 3 Jive中Jdom使用剖析 4 丰富的图释 5 使用正则表达式让你的jive显示图片 6 Jive...

Global site tag (gtag.js) - Google Analytics