如何在 C# 中读取以 view-source 开头的 URL

我想阅读以下 URL,它应该将页面中可用的内容保存到文本文件中。


我使用下面的代码来阅读页面源代码:


string address = "view-source:http://stackoverflow.com/";  //any web site url


using (WebClient wc = new WebClient())

{

    var Text= wc.DownloadString(address);            

}

但它抛出异常“无法识别 URI 前缀”。


任何帮助将不胜感激。


慕运维8079593
浏览 295回答 1
1回答

万千封印

您通过添加"view-source:"到该 url来使用 Chrome 的一项功能。本WebClient类可能不知道任何有关该功能的。它抱怨“URI 前缀”无法识别。那"view-source:"是你的字符串的一部分。因此,删除 URL 的那部分,您将拥有一个有效的 url。string userInput = "view-source:  string address = userInput.Replace("view-source:", "");注意:对于在运行和解释 javascript 后提供额外内容的 Web 应用程序,这可能会产生不同的结果。你可能最终得不到你想要的。编辑:在您发表评论后,听起来您想删除"view-source:"我在答案中反映的网址开头的可能性。以防万一您正在寻找“post javascript”源。github上有一个项目提供了这个功能,但我从来没有使用过。我只知道它,因为它是由与我一起工作的人维护的。您还可以在此 repl 中找到一个工作示例
打开App,查看更多内容
随时随地看视频慕课网APP