【Power Automate Desktopの教科書】正規表現の使い方　サンプルは？

Power Automate Desktopでは、正規表現が使えます。これを使うと、特定の条件の文字だけ見つけ出すということができます。

アルファベットだけの文字とか、数字だけの文字とかいう条件を検索するための表現です。

これを使えばC＃だろうが、PHPだろうが、同じように文字を検索して抜き出すことができます。

Power Automate Desktopでも正規表現が使えます。正規表現を使えば、ファイルやウェブページのHTMLから特定の文字列だけ抜き出して調べることができます。

タグを抜き出す正規表現は

<.*?>

を使います。

これは「<」と「>」の間にあるすべての文字という意味になります。

まず「テキスト＞テキストの解析」をフローに追加します。

先にテキストをセットしておきます。今回は「FileContents」にHTMLデータを読み込ませています。

検索するテキストで「<.*?>」を、正規表現であるを「オン」に、最初の出現場所を「オフ」にします。

f:id:apicode:20210326132702p:plain

すると開始位置はPositonsという変数に、見つかった文字はMatchesという変数に格納されます。

これで以下のようにフローを作成して実行します。

f:id:apicode:20210326132917p:plain

するとMatchesには、以下のように抜き出したタグのリストが入ります。

f:id:apicode:20210326132954p:plain

Postionsには以下のように開始位置のリストが入ります。

f:id:apicode:20210326133021p:plain

今回はH2タグだけ抜いてみましょう。

「<h2>.*?</h2>」を使います。

f:id:apicode:20210326133519p:plain

実行すると、以下のようにｈ２のタグのところだけ取得できました。

f:id:apicode:20210326133522p:plain

Power Automate Desktopの導入方法や基本的な使い方については以下参照ください。

クリエイターの教科書