· shortener python goo.gl

短縮URLサービスを作ってみた

goo.glサービスの終了ニュースで「短縮URLサービス作ってみた」の記事とか見かけたので、ちょうど自分も一ヶ月ほど前に作ったものがあったのでその解説をしようと思います。 作ってみたきっかけはサイドプロジェクトでSMS送信のところがあって、140文字の制限で長いURLは送れませんでした。それでGo言語用の go-shortener というライブラリ?まで作ってbit.lyとgoo.glを使ったのですが、ちょうどその時5日間の休みを取って海外旅行したので、飛行機の中と旅行先で自前の短縮URLサービスを作ってみたくなって作りました。

https://clacky.org

clacky.org ドメインは旅行先のシンガポールClarke Quayから来てます。(ドメインは短くないですが)

一定長さの文字列にする

ハッシュ関数を使ってすべての文字列を一定長さにする方法もありますが、

MD5    - 32文字
sha1   - 40文字
sha256 - 64文字
sha512 - 128文字

どれも短くありません。

ランダム文字列にしてデータベースに保存

一定長さのランダム文字列を生成してデータベースに保存して、マッピング表を作ります。同じランダム文字列のキーがあったらもう一回ランダム文字列を生成して同じキーがないところまで処理を繰り返します。これは短い文字列生成の目的は達成できますが、データの量が多くなると一つの処理で数千、数万、データの数分データベースにクエリを発行することになります。データベースに対しての負荷が大きすぎるので、現実的ではありませんでした。

データベースのIDを62進数に変換する

小文字、大文字アルファベット + 数字 = 62文字

URLをデータベースに保存して発行される連番IDを62進数に変換して短縮URLのキーにします。100億件のデータも62進数に変換すると6桁(aUKYOA)だけなので十分短いです。

pythonコード

chars = "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJELMNOPQRSTUVWXYZ"

def encode62(num, chars=chars):
    base = len(chars)
    string = ""
    while True:
        string = chars[num % base] + string
        num = num // base
        if num == 0:
            break
    return string

def decode62(string, chars=chars):
    base = len(chars)
    num = 0
    for char in string:
        num = num * base + chars.index(char)
    return num

e = encode62(99999999999)
print(e)  # 1L9zO9N

d = decode62('1L9zO9N')
print(d)  # 99999999999

ちょっと工夫

これで

すべてクリアしました。

これは自分の実装ですが、他によい方法あれば教えてください〜

シンガポールもう一度行ってみたい。