トップ  >  サンプルソース  >  リンク一覧取得(C#/VB.NET)

リンク一覧取得(C#/VB.NET)

2010年01月06日

WEBページ(HTML)を解析しサイト外(外部リンク)のURLを取得するサンプル(ソース/コード)です。NonUrlCheck.dll を使用しています。自分のブログにどんな外部リンクがあるか?気になりました。余分なリンクは出来るだけ削除したいです。

内部リンクを取得するサンプルは「URL一覧取得(C#/VB.NET)」です。

' -----------------------------------------------------------
' リンク一覧を取得するサンプル(VB.NET/VS2005)
' NonUrlCheck.dllを参照設定しています。
Private Sub Button1_Click( _
    ByVal sender As System.Object, _
    ByVal e As System.EventArgs) Handles Button1.Click

    ' リンク一覧取得するURLの指定
    NonUrlCheck.UrlCheckClass.Initialize()
    Dim dtUrl As DataTable = _
        NonUrlCheck.UrlCheckClass.InitDtUrl( _
        "http://xxx.blog111.fc2.com/", Nothing)

    ' リンク一覧取得開始
    Dim idx As Integer = 0
    Do While idx < dtUrl.Rows.Count
        ' リンク一覧取得
        NonUrlCheck.UrlCheckClass.GetAllUrl(dtUrl, idx)
        ' 外部リンクのみ取得(Out=1/内部リンクの場合はOut=0)
        If dtUrl.Rows(idx)("Out").ToString() = "1" Then
            ' リンク一覧表示
            Debug.WriteLine(dtUrl.Rows(idx)("Url").ToString())
        End If
        idx += 1
    Loop

    ' リンク一覧取得終了
    NonUrlCheck.UrlCheckClass.Terminate()
End Sub
' -----------------------------------------------------------

// ----------------------------------------------------------
// リンク一覧を取得するサンプル(C#.NET/VS2005)
// NonUrlCheck.dllを参照設定しています。
private void button1_Click(object sender, EventArgs e)
{
    // リンク一覧取得するURLの指定
    NonUrlCheck.UrlCheckClass.Initialize();
    DataTable dtUrl = NonUrlCheck.UrlCheckClass.InitDtUrl(
        "http://xxx.blog111.fc2.com/", null);

    // リンク一覧取得開始
    int idx = 0;
    while (idx < dtUrl.Rows.Count)
    {
        // リンク一覧取得
        NonUrlCheck.UrlCheckClass.GetAllUrl(dtUrl, ref idx);
        // 外部リンクのみ取得(Out=1/内部リンクの場合はOut=0)
        if (dtUrl.Rows[idx]["Out"].ToString() == "1")
        {
            // リンク一覧表示
            Debug.WriteLine(dtUrl.Rows[idx]["Url"].ToString());
        }
        idx += 1;
    }

    // リンク一覧取得終了
    NonUrlCheck.UrlCheckClass.Terminate();
}
// ----------------------------------------------------------
スポンサーサイト

HTMLエンコード(ツール) | トップページへ戻る | リンク切れチェック(C#/VB.NET)

このページのトップに戻る

コメント

名前
題名
メールアドレス
WEBサイト
 
コメント
パスワード
  管理者にだけ表示を許可する

このページのトップに戻る

トラックバック

このページのトップに戻る