CSharp - 解码文本文件

  显示原文与译文双语对照的内容
0 0

因这里,我将下面的文本加载到文本文本中,然后在 List 中读取 C# 程序,然后将 List 转换为字符串。 现在我想从所有HTML中解码字符串,但我不能。 现在有什么方法这是要格式化的文本:?


<p> <span style="font-size: 18px;"><strong>Varifr&aring;n kommer den svarta m&auml;rren&nbsp; i Sm&aring;land?</strong></span></p>
 <p> <span style="font-size: 14px;"><input checked="checked" name="ruta1" type="checkbox" value="Svar 1"/>&nbsp;Fr&aring;n Tyskland</span></p>
 <p> <input type="checkbox"/>Fr&aring;n Belgien</p>
 <p> &nbsp;</p>
 <p> <input type="checkbox"/>&nbsp;Fr&aring;n Turkiet</p>
 <p> &nbsp;</p>
 <p> &nbsp;</p>
<p> &nbsp;</p>


public partial class Form1 : Form
 {
 string temp ="TextKod.txt";
 string line ="";
 List<string> texten = new List<string>();
 string vetEj;
 string hoppSan;
 public Form1()
 {
 InitializeComponent();

 StreamReader sr = new StreamReader(temp);

 while ((line = sr.ReadLine())!= null)
 {
 string[] myarray = line.Split('r');
 vetEj = myarray[0];
 texten.Add(vetEj);
 }
 hoppSan = string.Join("r", texten);

时间: 原作者:

0 0

我想你真正想要的是:to编码编码。 但是,不管怎样,添加对 System.Web的引用并利用 HttpUtility 类。 要解码:


HttpUtility.HtmlDecode(htmlString);

并进行编码:


HttpUtility.HtmlEncode(htmlString);

要删除所有HTML元素,请执行以下操作:


var cleanHtml = Regex.Replace(htmlString,"<.*?>","");

你可以修改 正规表达式 到这个 <.*?>|&.*?;,以消除这些 &nbsp; 元素,但这与 Fr&aring;n Tyskland 中的&aring; 相匹配,因这里这取决于你。

原作者:
0 0

如果使用. NET 4.0 +,也可以使用 WebUtility.HtmlDecode,它不需要额外的程序集引用,因为它在 System.Net 命名空间中可用。

这也可以帮助


 myEncodedString = HttpUtility.HtmlEncode(string);

原作者:
...