xiaocainiao 发表于 2023-10-18 14:21:23

lisp如何获取网页中的文字内容

请教一下论坛的各位大神!


如何使用LISP、在不打开网页的情况下、获取指定网页上的文字内容、

例如获取链接 http://bbs.mjtd.com/thread-187771-1-1.html中的正文内容

注:如果没有网络能在程序中给个提示最好、谢谢

xj6019 发表于 2023-10-18 14:21:24

(defun try-get-url(url / ob html)
      (setq ob (vlax-create-object "Msxml2.XMLHTTP"))
      (vlax-invoke-method ob "open" "get" url "false")
      (vlax-invoke-method ob 'setRequestHeader "If-Modified-Since" "q");强制刷新
      (if (vl-catch-all-error-p (vl-catch-all-apply 'vlax-invoke-method (list ob "send")))
                (progn
                        (setq html nil);无网络连接
                        (vl-exit-with-error(alert "\n当前电脑环境没联网!"))
                )
                (setq html (vlax-get-property ob "responseText"))
      )
      (vlax-release-object ob)
      html
)

(try-get-url "http://bbs.mjtd.com/thread-187771-1-1.html ")

xiaocainiao 发表于 2023-10-18 15:06:58

xj6019 发表于 2023-10-18 14:36
(defun try-get-url(url / ob html)
      (setq ob (vlax-create-object "Msxml2.XMLHTTP"))
         ...

谢谢大神!我刚试了一下、这个代码的获取结果除了文字还有很多内容、我想问一下这个程序能不能只获取到文字内容、现在获取的内容太多、程序有点卡

nxchenjk 发表于 2023-11-23 14:43:35

xiaocainiao 发表于 2023-10-18 15:06
谢谢大神!我刚试了一下、这个代码的获取结果除了文字还有很多内容、我想问一下这个程序能不能只获取到文 ...

请问一下。问题解决了吗?我也想知道,

xiaocainiao 发表于 2023-11-23 19:25:40

nxchenjk 发表于 2023-11-23 14:43
请问一下。问题解决了吗?我也想知道,

目前用的就是楼上大神的方法、单纯获取网页文字的方法没有找到

xiaocainiao 发表于 2023-12-2 08:27:08

xj6019 发表于 2023-10-18 14:21
(defun try-get-url(url / ob html)
      (setq ob (vlax-create-object "Msxml2.XMLHTTP"))
         ...

请教大神、我现在用您这个代码后、有时候即使电脑联网也提示断网、这个一般是什么原因造成的啊

xj6019 发表于 2023-12-2 08:32:11

xiaocainiao 发表于 2023-12-2 08:27
请教大神、我现在用您这个代码后、有时候即使电脑联网也提示断网、这个一般是什么原因造成的啊

那个代码是大海兄的函数,我只是搬运了一下,具体的我也不懂呢

xiaocainiao 发表于 2023-12-2 08:34:43

xj6019 发表于 2023-12-2 08:32
那个代码是大海兄的函数,我只是搬运了一下,具体的我也不懂呢

好的、谢谢、我也是偶尔出现问题、大多数情况是好用的
页: [1]
查看完整版本: lisp如何获取网页中的文字内容