Hi,
I am working on the 1qg8 example given at http://salilab.org/modeller/wiki/Missing%20residues. I am trying to read the HETATM records and the waters.
Here is my alignment file.
>P1;1qg8
structureX:1qg8: 2 :A:+661 :A:MOL_ID 1; MOLECULE SPORE COAT POLYSACCHARIDE BIOSYNTHESIS PROTEIN SPSA; CHAIN A; ENGINEERED YES; OTHER_DETAILS GLYCEROL MAGNESIUM:MOL_ID 1; ORGANISM_SCIENTIFIC BACILLUS SUBTILIS; GENE SPSA; EXPRESSION_SYSTEM ESCHERICHIA COLI; EXPRESSION_SYSTEM_STRAIN BL 21: 1.50: 0.16
PKVSVIMTSYNKSDYVAKSISSILSQTFSDFELFIMDDNSNEETLNVIRPFLNDNRVRFYQSDISGVKERTEKTR
YAALINQAIEMAEGEYITYATDDNIYMPDRLLKMVRELDTHPEKAVIYSASKTYHLN---DIVKETVRPAAQVTW
NAPCAIDHCSVMHRYSVLEKVKEKFGSYWDESPAFYRIGDARFFWRVNHFYPFYPLDEELDLNYIT---------
-----EFVRNLPPQRNCRELRESLKKLGMG...wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
www*
>P1;1qg8_fill
sequence:::::::::
PKVSVIMTSYNKSDYVAKSISSILSQTFSDFELFIMDDNSNEETLNVIRPFLNDNRVRFYQSDISGVKERTEKTR
YAALINQAIEMAEGEYITYATDDNIYMPDRLLKMVRELDTHPEKAVIYSASKTYHLNENRDIVKETVRPAAQVTW
NAPCAIDHCSVMHRYSVLEKVKEKFGSYWDESPAFYRIGDARFFWRVNHFYPFYPLDEELDLNYITDQSIHFQLF
ELEKNEFVRNLPPQRNCRELRESLKKLGMG...wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
www*
I have run the python script and get an error like this.
Read the alignment from file : 1qg8.ali Total number of alignment positions: 678
# Code #_Res #_Segm PDB_code Name ------------------------------------------------------------------------------- 1 1qg8 661 1 1qg8 MOL_ID 1; MOLECULE SPORE COAT POLYSACCHARIDE BIOSYNTHESIS PROTEIN SPSA; CHAIN 2 1qg8_fill 678 1 check_a_343_> >> BEGINNING OF COMMAND openf___224_> Open .\1qg8.pdb
Dynamically allocated memory at amaxstructure [B,KiB,MiB]: 805668 786.785 0.768 read_pd_459W> Residue type GOL not recognized. 'automodel' model building will treat this residue as a rigid body. To use real parameters, add the residue type to ${LIB}/restyp.lib, its topology to ${LIB}/top_*.lib, and suitable forcefield parameters to ${LIB}/par.lib. read_te_290E> Number of residues in the alignment and pdb files are different: 661 637 For alignment entry: 1 1qg8 x (mismatch at alignment position 638) Alignment wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww PDB wwwwwwwwwwwwwwwwwwww Match ********************
Please check your alignment file header to be sure you correctly specified the starting and ending residue numbers and chains. The alignment sequence must match that from the atom file exactly.
Another possibility is that some residues in the atom file are missing, perhaps because they could not be resolved experimentally. (Note that Modeller reads only the ATOM and HETATM records in PDB, NOT the SEQRES records.) In this case, simply replace the section of your alignment corresponding to these missing residues with gaps. read_te_288W> Protein not accepted: 1 1qg8
The pdb file has 661 residues and 17 are missing. To read the hetatm records I have used '.' and for the waters I have used 'w'. Could you please tell me where I have gone wrong?
Thank you very much
Sajeewa Dewage