SEO ※当サイトのコンテンツには広告が含まれる場合があります。

キーワード出現率チェックツールを自作してみた【ソースコード付き】

ゆめただ

キーワード出現率チェックツールを自作してみた【ソースコード付き】

2語、3語指定できるキーワード出現率チェックツールが欲しい

findout
お調べさん
ゆめただのり
ゆめただ

こんなお悩みにお応えします。

キーワード出現率チェックは、SEOの重要な確認項目です。

無料で使えるキーワード出現率チェックサイトがありますが、

欲しい結果が得られないので、自作してみました。

本記事を読んでわかるコト・得られるモノ

・キーワード出現率チェックの必要性

・3語キーワードまで指定できるキーワード出現率チェックツール(複合キーワード対応)

・キーワード出現率ツールのソースコード

SEO2
ゆめただのり
ゆめただ

キーワード出現率の重要性を知って、

あなたも自分の記事をチェックしましょう。

ソースコードを掲載しています

本記事の最後に、ツールのプログラムのソースコードを掲載しています。

C言語のプログラムをコンパイルできる方は活用してください

Programming

この記事を書いた人

ゆめ ただ

グログ歴 5年目。
普通のビジネスマンとして働きながらFIREを目指す。
独学でゼロからブログを立ち上げる。
Dockerのローカル仮想環境を作りLinux環境も触るように。
4年目でSEO検定1級に合格し地道にスキルアップ。
次はWordPress以外のCMSに手を出そうか悩み中。

キーワード出現率チェックが必要な理由

キーワード出現率のチェックは、SEO対策として必須です。

上位表示されている記事のキーワード出現率を調べて、それに近づけていく方法が有効と言われています。

では、なぜキーワード出現率を毎回チェックするのでしょうか

なぜなら、キーワードによって「上位表示されている記事の出現率が異なる」からです。

キーワード毎に、上位表示されている記事のキーワード出現率をチェックして、そこに寄せていきましょう

SEO analytics team

ここがポイント

・キーワードによって、記事内のキーワード出現率が異なる。
・上位表示されている記事のキーワード出現率をチェックして、それに寄せていくコトがSEO対策の1つとなる。

キーワード出現率がチェックできる無料サイト

キーワード出現率がチェックできる無料サイトをまとめました。

ohotsuku

ohotsuku:無料のキーワード出現率チェックサイト。

URLを指定して、キーワードと出現目標率を指定。

あといくつキーワードを出現させれば目標に達成するかも教えてくれます

ohotsuku
ゆめただのり
ゆめただ

無料で便利なサイトです。

1キーワードまでしか指定できないところを、3キーワードまで対応させたいです。

追加したい機能

キーワードが1語しか指定できないので、複数キーワード調べたい場合は指定キーワードを変えて再検索する必要がある。
1度に3語まで指定したい。

ファンキーレイティング

ファンキーレイティング:無料のキーワード出現率チェックサイト。

URLもしくはテキストファイルを指定して、キーワードと出現目標率を指定

3語までキーワードを指定可能。あと何語出現させれば目標に達成するかも教えてくれます。

funkeyrating
ゆめただのり
ゆめただ

3キーワードまで指定でき、出現目標率も設定可能。

複合キーワードの検索ができないのて、対応させたいです。

改善したいポイント

検索キーワードが複合キーワードの場合、検索できない場合がある。
例1:「ラッコキーワード」->「ラッコ」+「キーワード」に分かれてしまうため検索できない。
例2:「検索ボリューム」->「検索」+「ボリューム」に分かれてしまうため検索できない。
複合キーワードに対応したい。

自作キーワード出現率チェックプログラムの仕様

キーワード出現率チェック無料サイトと,、自作ツールで実現したいことを比較表にまとめました。

\無料キーワード出現率チェックサイトと自作ツールの比較表/

キーワード出現率
チェック方法
指定できるキーワード数 総単語数総文字数 URL指定 ファイル入力 追加・改善ポイント
ohotsuku
sankaku
1語のみ
maru
対応
maru
非対応
maru
対応
batu
非対応
batu
キーワードが
1語しか指定できない
ファンキーレイティング
maru
3語まで指定可
maru
対応
batu
非対応
maru
対応
maru
対応
batu
複合キーワードが
検索できない
例:ラッコキーワード
自作プログラム
maru
3語まで対応
maru
対応
maru
対応
batu
非対応
maru
対応
maru
3語対応
複合キーワード対応
無料キーワード出現率チェックサイトと自作ツールの比較表

キーワード出現率チェック無料サイトの改善したいポイントを、自作ツールで実現することにしました。

 自作キーワード出現率チェックプログラムの仕様

  • キーワードは3語まで指定可能
  • 複合キーワードもチェック可能
  • 単語総数、総文字数も計算する
  • 入力はファイルのみ、URL指定は非対応
  • CSVファイルに出力できる
  • C言語で作成、Windowsのコマンドラインで動作する
SEO analytics

自作ツールの結果を評価

実際の記事を使って、自作ツールを評価してみました。

結果は次の通り。

まずまずの結果が得られています。

3語までキーワード指定ができ、複合キーワードを指定しても出現率を計算してくれます。

\キーワード出現率チェック無料サイトと自作ツールの結果比較/

キーワード出現率チェック方法単語総数キーワード出現数出現率
ohotsuku6400360.56%
ファンキーレイティング1560412.63%
ファンキーレイティング1485453.03%
自作ツール1688462.76%
キーワード出現率チェック無料サイトと自作ツールの結果比較
Checklist

比較結果

キーワード出現率チェック無料サイトの結果と、ほぼ同じような結果となった。

自作ツールのソースコード

今回生成した自作ツールのプログラムソースコードです。

参考にしてみてください。

【自作ツールのプログラムソースコード(C言語)】

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <ctype.h>
#include <mecab.h>

typedef struct WordNode {
    char *word;
        int count;
    double percentage;
        struct WordNode *next;
} WordNode;

const char *EXCLUDE_LIST[] = { 
    ",", ",", ".", "。", "、", "!", "!", "?", "?", ":", ":", ";", ";", "(", ")", "(", ")", 
        "\"", "“", "”", "'", "‘", "’", "-", "ー", "~", "[", "]", "{", "}", "「", "」", "『", "』", "【", "】",
    "と", "が", "に", "の", "は", "を", "で", "や", "から", "まで", "0", "1", "2", "3", "4", "5", "6", "7", "8", "9",
        "0", "1", "2", "3", "4", "5", "6", "7", "8", "9",
    "あ", "い", "う", "え", "お", "か", "き", "く", "け", "こ", "さ", "し", "す", "せ", "そ",
        "た", "ち", "つ", "て", "と", "な", "に", "ぬ", "ね", "の",
    "は", "ひ", "ふ", "へ", "ほ", "ま", "み", "む", "め", "も", "や", "ゆ", "よ", "ら", "り", "る", "れ", "ろ", "わ", "を", "ん",
        "が", "ぎ", "ぐ", "げ", "ご", "ざ", "じ", "ず", "ぜ", "ぞ", "だ", "ぢ", "づ", "で", "ど", "ば", "び", "ぶ", "べ", "ぼ",
    "、", "。", ",", ".", "・", ":", ";", "?", "!", "゛", "゜", "´", "`", "¨", 
        "^", "  ̄", "_", "ヽ", "ヾ", "ゝ", "ゞ", "〃", "仝", "々", "〆", "〇", "ー", "―", "‐", "/", 
    "\", "~", "∥", "|", "…", "‥", "‘", "’", "“", "”", "(", ")", "〔", "〕", "[", "]", 
        "{", "}", "〈", "〉", "《", "》", "「", "」", "『", "』", "【", "】", "+", "-", "±", "×", 

    "÷", "=","≠","<",">","≦","≧","∞","∴","♂","♀","°","′","″","℃","¥", "/", 

        "$", "¢", "£", "%", "#", "&", "*", "@", "§", "☆", "★", "○", "●", "◎", "◇", 

    "◆", "□", "■", "△", "▲", "▽", "▼", "※", "〒", "→", "←", "↑", "↓", " ", " ", "\n", "\r", NULL 
};

int is_excluded_word(const char *word) {
    if (strlen(word) == 0) return 1;
        for (int i = 0; EXCLUDE_LIST[i] != NULL; i++) {
        if (strcmp(word, EXCLUDE_LIST[i]) == 0) {
            return 1;
            }
    }
    for (int i = 0; word[i] != '\0'; i++) {
            if (isdigit((unsigned char)word[i])) {
                return 1;
        }
        }
        if ((strlen(word) == 1) && ((word[0] >= 0x3040 && word[0] <= 0x309F) || (word[0] >= 0x30A0 && word[0] <= 0x30FF))) {
        return 1;
    }
    return 0;
}

WordNode *add_or_increment_word(WordNode *head, const char *word) {
    if (is_excluded_word(word)) {
            return head;
        }
        WordNode *current = head;
    while (current != NULL) {
            if (strcmp(current->word, word) == 0) {
                current->count++;
            return head;
            }
            current = current->next;
        }
        WordNode *new_node = (WordNode *)malloc(sizeof(WordNode));
    new_node->word = strdup(word);
        new_node->count = 1;
    new_node->percentage = 0.0;
        new_node->next = head;
    return new_node;
}

void free_word_list(WordNode *head) {
    WordNode *current = head;
        while (current != NULL) {
        WordNode *next = current->next;
        free(current->word);
        free(current);
        current = next;
    }
}

int count_specific_word_in_text(const char *text, const char *word) {
    int count = 0;
        const char *temp = text;
    while ((temp = strstr(temp, word)) != NULL) {
            count++;
            temp += strlen(word);
        }
        return count;
}

int compare_words(const void *a, const void *b) {
    WordNode *wordA = *(WordNode **)a;
        WordNode *wordB = *(WordNode **)b;
    return wordB->count - wordA->count;
}

void calculate_percentages(WordNode *head, int total_words) {
    WordNode *current = head;
        while (current != NULL) {
        current->percentage = ((double)current->count / total_words) * 100;
        current = current->next;
    }
}

void print_word_list_to_csv(FILE *csv_file, WordNode **word_array, int word_count, int total_words) {
    fprintf(csv_file, "\xEF\xBB\xBF"); // BOMの追加
        fprintf(csv_file, "Word,Count,Percentage\n");
    for (int i = 0; i < word_count; i++) {
            fprintf(csv_file, "%s,%d,%.2f%%\n", word_array[i]->word, word_array[i]->count, word_array[i]->percentage);
        }
        fprintf(csv_file, "Total Words,%d\n", total_words);
}

void print_specific_words_to_csv(FILE *csv_file, const char **search_words, int search_word_count, const char *buffer, int total_words) {
    for (int i = 0; i < search_word_count; i++) {
            if (search_words[i] != NULL) {
                int specific_word_count = count_specific_word_in_text(buffer, search_words[i]);
            double percentage = ((double)specific_word_count / total_words) * 100;
                fprintf(csv_file, "%s,%d,%.2f%%\n", search_words[i], specific_word_count, percentage);
        }
        }
}

int main(int argc, char **argv) {
    if (argc < 3 || argc > 6) {
            fprintf(stderr, "Usage: %s <input file> <output file> <word1> <word2> <word3>\n", argv[0]);
            return 1;
        }

        const char *input_filename = argv[1];
    const char *output_filename = argv[2];
        const char *search_words[3] = { NULL, NULL, NULL };
    for (int i = 3; i < argc; i++) {
            search_words[i - 3] = argv[i];
        }

        FILE *fp = fopen(input_filename, "r");
    if (fp == NULL) {
            perror("fopen");
            return 1;
        }

        fseek(fp, 0, SEEK_END);
    long length = ftell(fp);
        fseek(fp, 0, SEEK_SET);

    char *buffer = (char *)malloc(length + 1);
        fread(buffer, 1, length, fp);
    buffer[length] = '\0';
        fclose(fp);

    int total_characters = strlen(buffer); // Count total characters

        mecab_t *mecab = mecab_new2("-d /usr/lib/x86_64-linux-gnu/mecab/dic/mecab-ipadic-neologd");
    if (mecab == NULL) {
            fprintf(stderr, "error in mecab_new2\n");
            return 1;
        }

        const mecab_node_t *node = mecab_sparse_tonode(mecab, buffer);
    if (node == NULL) {
            fprintf(stderr, "error in mecab_sparse_tonode\n");
            mecab_destroy(mecab);
            return 1;
        }

        int total_words = 0;
    WordNode *word_list = NULL;

        for (; node; node = node->next) {
        if (node->stat == MECAB_BOS_NODE || node->stat == MECAB_EOS_NODE) {
            continue;
            }
        char surface[1024];
        strncpy(surface, node->surface, node->length);
        surface[node->length] = '\0';
        if (!is_excluded_word(surface)) {
            word_list = add_or_increment_word(word_list, surface);
                total_words++;
        }
    }

    calculate_percentages(word_list, total_words);

        int word_count = 0;
    WordNode *current = word_list;
        while (current != NULL) {
        word_count++;
        current = current->next;
    }

    WordNode **word_array = (WordNode **)malloc(word_count * sizeof(WordNode *));
        current = word_list;
    for (int i = 0; i < word_count; i++) {
            word_array[i] = current;
            current = current->next;
        }

        qsort(word_array, word_count, sizeof(WordNode *), compare_words);

    FILE *csv_file = fopen(output_filename, "w");
        if (csv_file == NULL) {
        perror("fopen");
        return 1;
    }

    print_word_list_to_csv(csv_file, word_array, word_count, total_words);
        print_specific_words_to_csv(csv_file, search_words, 3, buffer, total_words);

    //Output total characters count to the CSV file
        fprintf(csv_file, "Total Characters,%d\n", total_characters);

        fclose(csv_file);
    free(word_array);
        free_word_list(word_list);
    mecab_destroy(mecab);
        free(buffer);
    return 0;
}

Software code

自作ツールのご利用にあたって

プログラムのコンパイル方法

本記事のソースコードのコンパイル方法は以下の通りです。

ファイル例

・ソースファイル:scan_kwd.c

・出力ファイル:scan_kwd

コンパイルコマンド例

-lオプションで、mecabライブラリを指定します。

プログラムの実行方法

プログラムの実行方法は以下の通りです。

ファイル例

・入力ファイル:input.txt

・出力ファイル:output.csv

・調査キーワード1:キーワード1

・調査キーワード2:キーワード2

・調査キーワード3:キーワード3

コマンド実行例

ツールご利用にあたって

本ツールを使用する場合、入力する記事を一旦テキストファイルに出力する必要があります。

記事をブラウザで表示させて、全体を選択しコピペしてテキストファイルに保存して使用してください。

競合サイトのページもコピペできれば、競合サイトのキーワード出現率もチェックできます。

ゆめただのり
ゆめただ

本プログラムのご利用は、自己責任でお願いします。

当サイトでは一切の責任を負いません。

\初心者向けSEOツールの記事はこちらから/

関連記事
reason-why-I-recommended-compass
COMPASSをおすすめする5つの理由

続きを見る

yumeada_avatar_sqr

ゆめただ

SEO検定1級保有  2019年に知識ゼロからブログを開設  独立を目指し当サイトを運営しています

-SEO