◆ 1文字アミノ酸配列から各種HTMLデータを作成する秀丸マクロ ◆

ダウンロード(zip形式圧縮ファイル;2010/07/09更新)

※2010/07/09,pdb_mini3.macを追加しDL版更新!! [NEW!]
※2008/05/08,pdb_org01.macを追加しDL版更新 → 同マクロ利用データによるコンテンツ例
※2008/03/28,日本化学会第88春季年会で本マクロについてポスター発表(報告ページ参照)
※2007/09/17,amino_aaa.macを追加しダウンロード版更新!!
※2006/05/17,アミノ酸のコンホメーション選択性識別マクロ(2種類)を追加
※2006/05/09,一部改変
※2005/06/14,amino_bcaa.macを追加しダウンロード版更新
※2005/02/11,Aspの疎水性インデックス順表示色を訂正
※同,PDBデータのサイズを小さくするマクロを追加掲載
※同,秀丸エディタのマクロライブラリ登録 [旧版です!]
※作例:βバレル型膜タンパク質の疎水性インデックス値
※作例:ノイラミニダーゼ立体構造予測データベース(理研)のデータより


1qd5をアミノ酸塩基の性質別に着色した例;右から二次構造,アミノ酸色,極性・非極性区別,疎水性インデックス順
PDB部分データリストで作成;アミノ酸の親水性・疎水性参照
※参考(膜貫通タンパク質や1qd5のもつβ-バレル構造に関する文献例):「細胞の分子生物学 第4版」,pp.593-614

 本秀丸エディタ用マクロは,1文字表記のアミノ酸配列データから以下に示すようないろいろなHTML形式の表を作成するものです。改変して様々な利用が可能と思います。改変等をされた場合は,利用した関連情報と一緒に作者までご連絡くだされば,公開可能なものはこのページで紹介させていただきます。


本マクロで作成される表のセルの着色(マクロ改変で変更可)についてはアミノ酸の親水性・疎水性参照
※表を範囲指定してExcelにペーストしても色は保持される


●1文字表記のアミノ酸配列データの入手とマクロによる本加工について(PDBデータ1qd5を例に)

 Protein Data Bank (RCSB PDB)を利用して,1qd5でChime形式の分子モデルが参照できる。
 同ページの左側メニューの Sequence Details をクリックすると以下のような配列データを参照できる。50塩基ごとに区切られ,その下行にhelixなどの二次構造情報が付記されている。

 なお,二次構造情報は以下のように同じタンパク質でもデータソースによって異なるので注意する。


Sequence DetailsページのProtein Dossierをクリックして参照できる1qd5の二次構造情報(青矢印がβ-シート部分)

 また,Sequence Detailsページ最下行の Download in FASTA format をクリックすると以下のような形式で配列が表示される。なお,このデータを用いれば,SOSUI WWW Serverを利用して膜貫通部分が存在するかどうかシミュレーションすることもできる(PDBとSOSUIを利用した演習参照)。

 PDB形式データのヘッダには,以下の例のような二次構造情報が記載されている(1qd5のβ-シート部分の抜粋)

※参考:よくある質問(PDBj)PDBレコードの説明(簡易版)

 以上のような情報などから,HTML化したいデータ配列を作成する。以下は1qd5のβ-シート部分を抜き出した例である。

 このようなデータを作成したら(例えば単純に20配列ずつ区切るのでもよい),各マクロにより以下に列記するようなHTML形式データ等を自動で作成することができる。なお,間違ってマクロを使用した場合に備えて,データ末尾に元の1文字配列データを残すようにしてあるので,削除してからデータを拡張子htmlで保存すればブラウザで参照できる。また,アミノ酸記号以外はすべて空白セルに変換する設定になっている。これらはマクロ改変により修正可能である。


秀丸によるマクロ実行の例
※解凍したマクロ(*.mac)を秀丸のプログラムがあるフォルダ(通常は \Program Files\Hidemaru)に置いて利用



amino_bcaa.macによる加工(BCAAのIleValLeuおよびCysの区別とカウント) → 参考:今週の分子/BCAA

(1) 1a02のChain F(Leucine Zipper含む)の場合BCAAその2;Leucine Zipperを含むタンパク質例参照
※1行7残基で作成〔Leucine Zipperの配列:L-x(6)-L-x(6)-L-x(6)-LGoogleによる「"leucine zipper" PROSITE」検索結果
Met Lys Arg Arg Ile Arg Arg
Glu Arg Asn Lys Met Ala Ala
Ala Lys Ser Arg Asn Arg Arg
Arg Glu Leu Thr Asp Thr Leu
Gln Ala Glu Thr Asp Gln Leu
Glu Asp Glu Lys Ser Ala Leu
Gln Thr Glu Ile Ala Asn Leu
Leu Lys Glu Lys Glu Lys Leu
Ile = 2
Val = 0
Leu = 7
Cys = 0
Total = 56


(2) 1dmd(Cysリッチ)の場合メタロチオネインの例参照
※1行10残基
Ser Pro Cys Gln Lys Cys Thr Ser Gly Cys
Lys Cys Ala Thr Lys Glu Glu Cys Ser Lys
Thr Cys Thr Lys Pro Cys Ser Cys Cys Pro
Lys
Ile = 0
Val = 0
Leu = 0
Cys = 9
Total = 31


(3) 1tupのChain B(Zinc Finger含む)の場合DNAの脆弱性と強靭性/p53参照
※1行20残基〔赤字がZinc FingerのCys176・His179・Cys238・Cys242;Googleによる「"Zinc Finger" PROSITE」検索結果も参照〕
Ser Ser Ser Val Pro Ser Gln Lys Thr Tyr Gln Gly Ser Tyr Gly Phe Arg Leu Gly Phe
Leu His Ser Gly Thr Ala Lys Ser Val Thr Cys Thr Tyr Ser Pro Ala Leu Asn Lys Met
Phe Cys Gln Leu Ala Lys Thr Cys Pro Val Gln Leu Trp Val Asp Ser Thr Pro Pro Pro
Gly Thr Arg Val Arg Ala Met Ala Ile Tyr Lys Gln Ser Gln His Met Thr Glu Val Val
Arg Arg Cys Pro His His Glu Arg Cys Ser Asp Ser Asp Gly Leu Ala Pro Pro Gln His
Leu Ile Arg Val Glu Gly Asn Leu Arg Val Glu Tyr Leu Asp Asp Arg Asn Thr Phe Arg
His Ser Val Val Val Pro Tyr Glu Pro Pro Glu Val Gly Ser Asp Cys Thr Thr Ile His
Tyr Asn Tyr Met Cys Asn Ser Ser Cys Met Gly Gly Met Asn Arg Arg Pro Ile Leu Thr
Ile Ile Thr Leu Glu Asp Ser Ser Gly Asn Leu Leu Gly Arg Asn Ser Phe Glu Val Arg
Val Cys Ala Cys Pro Gly Arg Asp Arg Arg Thr Glu Glu Glu Asn Leu Arg Lys Lys Gly
Glu Pro His His Glu Leu Pro Pro Gly Ser Thr Lys Arg Ala Leu Pro Asn Asn Thr
Ile = 6
Val = 15
Leu = 16
Cys = 10
Total = 219


(4) amino_bcaa.mac改変版(ValGly抽出用)による1k28のChain Aの場合T4ファージのgp5タンパク質例参照
※1行30残基〔C末端側の三角形筒構造はVXGXXXXXの8残基のサイクルで形成;Valが8残基の先頭,灰色のセルは手作業による〕
Met Glu Met Ile Ser Asn Asn Leu Asn Trp Phe Val Gly Val Val Glu Asp Arg Met Asp Pro Leu Lys Leu Gly Arg Val Arg Val Arg
Val Val Gly Leu His Pro Pro Gln Arg Ala Gln Gly Asp Val Met Gly Ile Pro Thr Glu Lys Leu Pro Trp Met Ser Val Ile Gln Pro
Ile Thr Ser Ala Ala Met Ser Gly Ile Gly Gly Ser Val Thr Gly Pro Val Glu Gly Thr Arg Val Tyr Gly His Phe Leu Asp Lys Trp
Lys Thr Asn Gly Ile Val Leu Gly Thr Tyr Gly Gly Ile Val Arg Glu Lys Pro Asn Arg Leu Glu Gly Phe Ser Asp Pro Thr Gly Gln
Tyr Pro Arg Arg Leu Gly Asn Asp Thr Asn Val Leu Asn Gln Gly Gly Glu Val Gly Tyr Asp Ser Ser Ser Asn Val Ile Gln Asp Ser
Asn Leu Asp Thr Ala Ile Asn Pro Asp Asp Arg Pro Leu Ser Glu Ile Pro Thr Asp Asp Asn Pro Asn Met Ser Met Ala Glu Met Leu
Arg Arg Asp Glu Gly Leu Arg Leu Lys Val Tyr Trp Asp Thr Glu Gly Tyr Pro Thr Ile Gly Ile Gly His Leu Ile Met Lys Gln Pro
Val Arg Asp Met Ala Gln Ile Asn Lys Val Leu Ser Lys Gln Val Gly Arg Glu Ile Thr Gly Asn Pro Gly Ser Ile Thr Met Glu Glu
Ala Thr Thr Leu Phe Glu Arg Asp Leu Ala Asp Met Gln Arg Asp Ile Lys Ser His Ser Lys Val Gly Pro Val Trp Gln Ala Val Asn
Arg Ser Arg Gln Met Ala Leu Glu Asn Met Ala Phe Gln Met Gly Val Gly Gly Val Ala Lys Phe Asn Thr Met Leu Thr Ala Met Leu
Ala Gly Asp Trp Glu Lys Ala Tyr Lys Ala Gly Arg Asp Ser Leu Trp Tyr Gln Gln Thr Lys Gly Arg Ala Ser Arg Val Thr Met Ile
Ile Leu Thr Gly Asn Leu Glu Ser Tyr Gly Val Glu Val Lys Thr Pro Ala Arg Ser Leu Ser Ala Met Ala Ala Thr Val Ala Lys Ser
Ser Asp Pro Ala Asp Pro Pro Ile Pro Asn Asp Ser Arg Ile Leu Phe Lys Glu Pro Val Ser Ser Tyr Lys Gly Glu Tyr Pro Tyr Val
His Thr Met Glu Thr Glu Ser Gly His Ile Gln Glu Phe Asp Asp Thr Pro Gly Gln Glu Arg Tyr Arg Leu Val His Pro Thr Gly Thr
Tyr Glu Glu Val Ser Pro Ser Gly Arg Arg Thr Arg Lys Thr Val Asp Asn Leu Tyr Asp Ile Thr Asn Ala Asp Gly Asn Phe Leu Val
Ala Gly Asp Lys Lys Thr Asn Val Gly Gly Ser Glu Ile Tyr Tyr Asn Met Asp Asn Arg Leu His Gln Ile Asp Gly Ser Asn Thr Ile
Phe Val Arg Gly Asp Glu Thr Lys Thr Val Glu Gly Asn Gly Thr Ile Leu Val Lys Gly Asn Val Thr Ile Ile Val Glu Gly Asn Ala
Asp Ile Thr Val Lys Gly Asp Ala Thr Thr Leu Val Glu Gly Asn Gln Thr Asn Thr Val Asn Gly Asn Leu Ser Trp Lys Val Ala Gly
Thr Val Asp Trp Asp Val Gly Gly Asp Trp Thr Glu Lys Met Ala Ser Met Ser Ser Ile Ser Ser Gly Gln Tyr Thr Ile Asp Gly Ser
Arg Ile Asp Ile Gly Ser Val Asp His His His His His His
Val = 49
Gly = 61
Total = 584



1gwlのSITE部分(全SITE情報のうちBMA近傍だけにしてTyr46追加;黄緑色が芳香族アミノ酸)
※参考:セルラーゼの話題(三重大学・苅田修一研究室)セルロース結合モジュール(ドメイン)とは




:αヘリックス選択性,:βストランド選択性,:逆ターン選択性,:HELIX(PDBデータのヘッダ),:SHEET(同)

amino_2ndv.macで作成した表をExcelでグラフ化した例〔上〕と二次構造・コンホメーション選択性表示のアニメーション〔下〕
(PDBデータ1apsのModel 1の場合;スーパーフォールドの例であるαβサンドイッチ構造)
※参考:タンパク質二次構造予測JST ゲノム解析ツール リンク集



PDBデータ1c9eの二次構造とコンホメーション選択性表示のアニメーション(生体分子の構成元素で作成)

    (4b) PDBsumのLigand-SITE情報データを小さくすると同時に有機性・無機性を算出するマクロ/核酸用  ※pdb_org01_ATGCU.mac

      
      // HB情報を含むPDBsumデータを加工し有機概念図の有機性・無機性を計算するマクロ
      //  pdb_org01_ATGCU.mac(核酸データのみ用)
      // 詳細: http://www.ecosci.jp/pdb/hm/macro_g1.html
      // 有機概念図: http://www.ecosci.jp/ocd/
      
      gofiletop;
      searchdown "\\nATOM" , regular;
      beginsel;
      gofiletop;
      delete;
      
      searchdown "\\nCONECT" , regular;
      	if ( result == true ) {
      		beginsel;
      	}
      	else {
      		gofiletop;
      		searchdown "\\nMASTER" , regular;
      		beginsel;
      	}
      searchdown "\z" , regular;
      delete;
      
      #line = y;
      #n = #line;
      
      gofiletop;
      delete;
      right 54;
      
      beginrect;
      moveto 82, #n;
      delete;
      
      gofiletop;
      
      #nn = 0;
      #b01 = 0;
      #b02 = 0;
      #b03 = 0;
      #b04 = 0;
      #b05 = 0;
      #b06 = 0;
      #no = 0;
      #ni = 0;
      
      while(1){
      	searchdown "  P   ";
      	if ( result == true ) {
      	golinetop;
      	selectline;
      	$a = gettext(seltopx, seltopy, selendx, selendy);
      	$b = midstr($a, 17, 3);
      	if(($b=="  A") || ($b==" DA")) {#b01 = #b01 + 1;
      		#no = #no + 100;
      		#ni = #ni + 410;
      		}
      	else if(($b=="  T") || ($b==" DT")) {#b02 = #b02 + 1;
      		#no = #no + 100;
      		#ni = #ni + 282;
      		}
      	else if(($b=="  G") || ($b==" DG")) {#b03 = #b03 + 1;
      		#no = #no + 100;
      		#ni = #ni + 440;
      		}
      	else if(($b=="  C") || ($b==" DC")) {#b04 = #b04 + 1;
      		#no = #no + 80;
      		#ni = #ni + 287;
      		}
      	else if(($b=="  U") || ($b==" DU")) {#b05 = #b05 + 1;
      		#no = #no + 80;
      		#ni = #ni + 282;
      		}
      	else #b06 = #b06 + 1;
      	escape;
      	down 1;
      	#nn = #nn +1;
      	}
      	else{
      	break;
      	}
      	}
      
      gofiletop;
      	insert "# "+"\n";
      	insert "# "+"\n";
      	insert "# O(R) = "+str(#no)+"\n";
      	insert "# I(R) = "+str(#ni)+"\n";
      	insert "#    A = "+str(#b01)+"\n";
      	insert "#    T = "+str(#b02)+"\n";
      	insert "#    G = "+str(#b03)+"\n";
      	insert "#    C = "+str(#b04)+"\n";
      	insert "#    U = "+str(#b05)+"\n";
      	insert "#  others = "+str(#b06)+"\n";
      
      endmacro;
      

  
[左]ネオマイシン(neomycin B,アミノグリコシド系)が結合したRNA 1ei2のPDBsumデータ → 抗生物質を含むPDBデータ
[右]DNA・RNAの塩基部分の有機概念図



「分子の形と性質」学習帳「生活環境化学の部屋」ホームページ