程序员最近都爱上了这个网站  程序员们快来瞅瞅吧!  it98k网:it98k.com

本站消息

站长简介/公众号

  出租广告位,需要合作请联系站长

+关注
已关注

分类  

暂无分类

标签  

暂无标签

日期归档  

暂无数据

如何使用正则表达式从python中删除字符串中的标签?(不是HTML)

发布于2019-09-11 11:42     阅读(924)     评论(0)     点赞(28)     收藏(2)


我需要从python中的字符串中删除标签。

<FNT name="Century Schoolbook" size="22">Title</FNT>

删除两端的整个标记的最有效方法是什么,只留下“标题”?我只看到过使用HTML标签做到这一点的方法,而这在python中对我没用。我正在使用这个特别适用于GIS程序ArcMap。它有自己的布局元素标签,我只需删除两个特定标题文本元素的标签。我相信正则表达式应该可以正常使用,但我对任何其他建议持开放态度。


解决方案


这应该工作:

import re
re.sub('<[^>]*>', '', mystring)

对于每个人说正则表达式不是正确的工具:

问题的背景是关于常规/无上下文语言的所有异议都是无效的。他的语言主要由三个实体:a = <b = >,和c = [^><]+他想删除任何事件acb这直接将他的问题描述为涉及无上下文语法的问题,并且将其定性为常规语法并不困难。

我知道每个人都喜欢“你不能用正则表达式解析HTML”的答案,但是OP不想解析它,他只是想进行简单的转换。



所属网站分类: 技术文章 > 问答

作者:黑洞官方问答小能手

链接:https://www.pythonheidong.com/blog/article/106946/955683c72ab0b3d4189d/

来源:python黑洞网

任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任

28 0
收藏该文
已收藏

评论内容:(最多支持255个字符)