C# ile HTML Taglarını Silme



Elinizde <html> taglarından oluşan bir metin var.Siz sadece metni alarak onun üzerinde işlem yapmak istiyorsunuz.Peki html kodları içerisindeki metni C#.Net ile nasıl saf şekile getiririz ?

Html kodları standart olarak büyük-küçük ( < > ) karakterleri arasına tanımlanarak yazılır.Yani başlangıç olarak küçüktür ( < ) karakterini baz alarak döngüyle döneriz ve büyüktür ( > ) karakterine ulaşırız.Bu da aşağı yukarı nasıl bir algoritmada ilerleyeceğimizi belli ediyor.Kodlar yazının devamında.


    public static string StripTagsCharArray(string source)
    {
 char[] array = new char[source.Length];
 int arrayIndex = 0;
 bool inside = false;

 for (int i = 0; i < source.Length; i++)
 {
     char let = source[i];
     if (let == '<')
     {
  inside = true;
  continue;
     }
     if (let == '>')
     {
  inside = false;
  continue;
     }
     if (!inside)
     {
  array[arrayIndex] = let;
  arrayIndex++;
     }
 }
 return new string(array, 0, arrayIndex);
    }


Detaylı bilgi için DotNetPerls

Yorumlar