登录 立即注册

找到11347个回复

胡椒舰长 1楼回复 MKksweb最新版完美使用 (2023-09-08//)
如何在iphone上面跑php workerman

https://www.workerman.net/q/6703
老李 17楼回复 晨曦出几个ChatGPT账号 (2023-09-07//)
@晨曦,大佬你的平台不能充值,想买个gpt帐号,怎么付款给你?
咯叽 7楼回复 希望自己长胖胖华为发布了崭新旗舰手机 (2023-09-07//)
层主 @咯叽 于 2023-10-07 23:12 删除了该楼层。
老虎会游泳 6楼回复 希望自己长胖胖华为发布了崭新旗舰手机 (2023-09-06//)
ttthhh 91楼回复 老虎会游泳向日葵控控A2(OrayKVM)U盘救砖/USB恢复模式说明/免U盘刷机教程 (2023-09-06//)
层主 @ttthhh 于 2023-09-07 00:27 删除了该楼层。
希望自己长胖胖 5楼回复 希望自己长胖胖华为发布了崭新旗舰手机 (2023-09-06//)
@皮皮虎
不会吧,少2000块?难道是拼多多?。
没落的情绪 7楼回复 HongKongDoll安利个西部数码的fun域名,可以备案 (2023-09-05//)

有多少个虎友注册了?
小米11PRO(黑)

皮皮虎 4楼回复 希望自己长胖胖华为发布了崭新旗舰手机 (2023-09-05//)
村通网?上个月29日就开售了,12+512是6999
MK 3楼回复 MK谁还有爱特文件管理原码? (2023-09-03//)
@天天@晨曦,谢谢!
小尾巴华为Mate50 Pro鸡佬版
大尨 2楼回复 希望自己长胖胖华为发布了崭新旗舰手机 (2023-09-03//)
有点贵
晨曦 2楼回复 MK谁还有爱特文件管理原码? (2023-09-03//)
官网https://aite.xyz/
我是晨曦,我喂自己袋盐!
天天 1楼回复 MK谁还有爱特文件管理原码? (2023-09-03//)
https://aite.xyz/product/fileadmin.zip
老虎会游泳 10楼回复 无名啊如何像正则一样验证 HTML 并提取出捕获内容? (2023-09-02//)

虽然 XSLT 最初被设计为用于 XML 转换的专用语言,但该语言是图灵完备的,这使得它理论上能够进行任意计算。

XSLT 2.0 最重要的创新包括:
使用正则表达式进行字符串操作

XSLT 3.0
支持映射和数组,使 XSLT 能够处理 JSON 和 XML。
改进了对动态错误的处理,例如使用 xsl:try 指令。

https://en.m.wikipedia.org/wiki/XSLT

440px-XSLT_en.svg.png(65.84 KB)

老虎会游泳 9楼回复 无名啊如何像正则一样验证 HTML 并提取出捕获内容? (2023-09-02//)
无名啊 8楼回复 无名啊如何像正则一样验证 HTML 并提取出捕获内容? (2023-09-02//)

@老虎会游泳,好像有点接近,等会儿去看看用法。先谢谢老虎

老虎会游泳 7楼回复 无名啊如何像正则一样验证 HTML 并提取出捕获内容? (2023-09-02//)

@无名啊,搜“XSLT html to json”可以看到一些案例。

比如这个:

https://stackoverflow.com/questions/18055368/html-to-json-conversion-in-xslt

无名啊 6楼回复 无名啊如何像正则一样验证 HTML 并提取出捕获内容? (2023-09-02//)

@老虎会游泳

用 xpath、css 选择器 来批量提取数据有些吃力

CSS 选择器、xpath 我都用过,对于提取单独几条挺好用的。

但是批量提取整个页面的数据,就麻烦多了。

所以想着有没有验证 HTML 结构的同时,还能提取出内容的。

为啥要验证

页面结构很动态,目前我只能靠验证来确定:

  1. 有可能会出现什么元素,不遗漏元素,也不误解元素含义(比如老虎林首页,还有可能出现 [公开][被下沉][评论关闭] 之类的)

  2. 防止日后结构变化时不自知

老虎会游泳 5楼回复 无名啊如何像正则一样验证 HTML 并提取出捕获内容? (2023-09-02//)

@无名啊,这是最接近你想要的东西:

XSLTJSON: Transforming XML to JSON using XSLT

https://github.com/bramstein/xsltjson

XSLT是一种样式表,用于把XML转换为其他表现形式(比如可显示的HTML,甚至是JSON)。该样式表也可以用于验证输入是否与样式匹配。

不过HTML不是严格的XML,不清楚解析器是否能正确处理HTML中的宽松语法。

老虎会游泳 4楼回复 无名啊如何像正则一样验证 HTML 并提取出捕获内容? (2023-09-02//)

PHP版:https://symfony.com/doc/current/components/dom_crawler.html

If you prefer CSS selectors over XPath, install The CssSelector Component. It allows you to use jQuery-like selectors:

$crawler = $crawler->filter('body > p');
老虎会游泳 3楼回复 无名啊如何像正则一样验证 HTML 并提取出捕获内容? (2023-09-02//)

querySelector的nodejs版本:
https://www.npmjs.com/package/query-selector

下一页 上一页 (147 / 568页)

9月26日 08:58 星期五

本站由hu60wap6驱动

备案号: 京ICP备18041936号-1