UniProt seq
|
|||||
KC1G2_HUMAN_D0
|
M
D
F
D
K
K
G
G
K
G
E
T
E
E
G
R
R
M
S
K
A
G
G
G
R
S
S
H
G
I
R
S
S
G
T
S
S
G
V
L
M
V
G
P
N
F
R
V
G
K
K
I
G
C
G
N
F
G
E
L
R
L
G
K
N
L
Y
T
N
E
Y
V
A
I
K
L
E
P
I
K
S
R
A
P
Q
L
H
L
E
Y
R
F
Y
K
Q
L
S
A
T
E
G
V
P
Q
V
Y
Y
F
G
P
C
G
K
Y
N
A
M
V
L
E
L
L
G
P
S
L
E
D
L
F
D
L
C
D
R
T
F
T
L
K
T
V
L
M
I
A
I
Q
L
I
T
R
M
E
Y
V
H
T
K
S
L
I
Y
R
D
V
K
P
E
N
F
L
V
G
R
P
G
T
K
R
Q
H
A
I
H
I
I
D
F
G
L
A
K
E
Y
I
D
P
E
T
K
K
H
I
P
Y
R
E
H
K
S
L
T
G
T
A
R
Y
M
S
I
N
T
H
L
G
K
E
Q
S
R
R
D
D
L
E
A
L
G
H
M
F
M
Y
F
L
R
G
S
L
P
W
Q
G
L
K
A
D
T
L
K
E
R
Y
Q
K
I
G
D
T
K
R
A
T
P
I
E
V
L
C
E
N
F
P
E
E
M
A
T
Y
L
R
Y
V
R
R
L
D
F
F
E
K
P
D
Y
D
Y
L
R
K
L
F
T
D
L
F
D
R
S
G
F
V
F
D
Y
E
Y
D
W
A
G
K
P
L
P
T
P
I
G
T
V
H
T
D
L
P
S
Q
P
Q
L
R
D
K
T
Q
P
H
S
K
N
Q
A
L
N
S
T
N
G
E
L
N
A
D
D
P
T
A
G
H
S
N
A
P
I
T
A
P
A
E
V
E
V
A
D
E
T
K
C
C
C
F
F
K
R
R
K
R
K
S
L
Q
R
H
K
-
|
||||
Plasmids
|
nconf
|
nextran
|
|||
HsCD00037988
|
0
|
145
|
M
D
F
D
K
K
G
G
K
G
E
T
E
E
G
R
R
M
S
K
A
G
G
G
R
S
S
H
G
I
R
S
S
G
T
S
S
G
V
L
M
V
G
P
N
F
R
V
G
K
K
I
G
C
G
N
F
G
E
L
R
L
G
K
N
L
Y
T
N
E
Y
V
A
I
K
L
E
P
I
K
S
R
A
P
Q
L
H
L
E
Y
R
F
Y
K
Q
L
S
A
T
E
G
V
P
Q
V
Y
Y
F
G
P
C
G
K
Y
N
A
M
V
L
E
L
L
G
P
S
L
E
D
L
F
D
L
C
D
R
T
F
T
L
K
T
V
L
M
I
A
I
Q
L
I
T
R
M
E
Y
V
H
T
K
S
L
I
Y
R
D
V
K
P
E
N
F
L
V
G
R
P
G
T
K
R
Q
H
A
I
H
I
I
D
F
G
L
A
K
E
Y
I
D
P
E
T
K
K
H
I
P
Y
R
E
H
K
S
L
T
G
T
A
R
Y
M
S
I
N
T
H
L
G
K
E
Q
S
R
R
D
D
L
E
A
L
G
H
M
F
M
Y
F
L
R
G
S
L
P
W
Q
G
L
K
A
D
T
L
K
E
R
Y
Q
K
I
G
D
T
K
R
A
T
P
I
E
V
L
C
E
N
F
P
E
E
M
A
T
Y
L
R
Y
V
R
R
L
D
F
F
E
K
P
D
Y
D
Y
L
R
K
L
F
T
D
L
F
D
R
S
G
F
V
F
D
Y
E
Y
D
W
A
G
K
P
L
P
T
P
I
G
T
V
H
T
D
L
P
S
Q
P
Q
L
R
D
K
T
Q
P
H
S
K
N
Q
A
L
N
S
T
N
G
E
L
N
A
D
D
P
T
A
G
H
S
N
A
P
I
T
A
P
A
E
V
E
V
A
D
E
T
K
C
C
C
F
F
K
R
R
K
R
K
S
L
Q
R
H
K
l
|
||
23705
|
1
|
144
|
M
D
F
D
K
K
G
G
K
G
E
T
E
E
G
R
R
M
S
K
A
G
G
G
R
S
S
H
G
I
R
S
S
G
T
S
S
G
V
L
M
V
G
P
N
F
R
V
G
K
K
I
G
C
G
N
F
G
E
L
R
L
G
K
N
L
Y
T
N
E
Y
V
A
I
K
L
E
P
I
K
S
R
A
P
Q
L
H
L
E
Y
R
F
Y
K
Q
L
S
A
T
E
G
V
P
Q
V
Y
Y
F
G
P
C
G
n
Y
N
A
M
V
L
E
L
L
G
P
S
L
E
D
L
F
D
L
C
D
R
T
F
T
L
K
T
V
L
M
I
A
I
Q
L
I
T
R
M
E
Y
V
H
T
K
S
L
I
Y
R
D
V
K
P
E
N
F
L
V
G
R
P
G
T
K
R
Q
H
A
I
H
I
I
D
F
G
L
A
K
E
Y
I
D
P
E
T
K
K
H
I
P
Y
R
E
H
K
S
L
T
G
T
A
R
Y
M
S
I
N
T
H
L
G
K
E
Q
S
R
R
D
D
L
E
A
L
G
H
M
F
M
Y
F
L
R
G
S
L
P
W
Q
G
L
K
A
D
T
L
K
E
R
Y
Q
K
I
G
D
T
K
R
A
T
P
I
E
V
L
C
E
N
F
P
E
E
M
A
T
Y
L
R
Y
V
R
R
L
D
F
F
E
K
P
D
Y
D
Y
L
R
K
L
F
T
D
L
F
D
R
S
G
F
V
F
D
Y
E
Y
D
W
A
G
K
P
L
P
T
P
I
G
T
V
H
T
D
L
P
S
Q
P
Q
L
R
D
K
T
Q
P
H
S
K
N
Q
A
L
N
S
T
N
G
E
L
N
A
D
D
P
T
A
G
H
S
N
A
P
I
T
A
P
A
E
V
E
V
A
D
E
T
K
C
C
C
F
F
K
R
R
K
R
K
S
L
Q
R
H
K
-
|
||
HsCD00038312
|
1
|
144
|
M
D
F
D
K
K
G
G
K
G
E
T
E
E
G
R
R
M
S
K
A
G
G
G
R
S
S
H
G
I
R
S
S
G
T
S
S
G
V
L
M
V
G
P
N
F
R
V
G
K
K
I
G
C
G
N
F
G
E
L
R
L
G
K
N
L
Y
T
N
E
Y
V
A
I
K
L
E
P
I
K
S
R
A
P
Q
L
H
L
E
Y
R
F
Y
K
Q
L
S
A
T
E
G
V
P
Q
V
Y
Y
F
G
P
C
G
n
Y
N
A
M
V
L
E
L
L
G
P
S
L
E
D
L
F
D
L
C
D
R
T
F
T
L
K
T
V
L
M
I
A
I
Q
L
I
T
R
M
E
Y
V
H
T
K
S
L
I
Y
R
D
V
K
P
E
N
F
L
V
G
R
P
G
T
K
R
Q
H
A
I
H
I
I
D
F
G
L
A
K
E
Y
I
D
P
E
T
K
K
H
I
P
Y
R
E
H
K
S
L
T
G
T
A
R
Y
M
S
I
N
T
H
L
G
K
E
Q
S
R
R
D
D
L
E
A
L
G
H
M
F
M
Y
F
L
R
G
S
L
P
W
Q
G
L
K
A
D
T
L
K
E
R
Y
Q
K
I
G
D
T
K
R
A
T
P
I
E
V
L
C
E
N
F
P
E
E
M
A
T
Y
L
R
Y
V
R
R
L
D
F
F
E
K
P
D
Y
D
Y
L
R
K
L
F
T
D
L
F
D
R
S
G
F
V
F
D
Y
E
Y
D
W
A
G
K
P
L
P
T
P
I
G
T
V
H
T
D
L
P
S
Q
P
Q
L
R
D
K
T
Q
P
H
S
K
N
Q
A
L
N
S
T
N
G
E
L
N
A
D
D
P
T
A
G
H
S
N
A
P
I
T
A
P
A
E
V
E
V
A
D
E
T
K
C
C
C
F
F
K
R
R
K
R
K
S
L
Q
R
H
K
-
|
||
HsCD00038250
|
1
|
145
|
M
D
F
D
K
K
G
G
K
G
E
T
E
E
G
R
R
M
S
K
A
G
G
G
R
S
S
H
G
I
R
S
S
G
T
S
S
G
V
L
M
V
G
P
N
F
R
V
G
K
K
I
G
C
G
N
F
G
E
L
R
L
G
K
N
L
Y
T
N
E
Y
V
A
I
K
L
E
P
I
K
S
R
A
P
Q
L
H
L
E
Y
R
F
Y
K
Q
L
S
A
T
E
G
V
P
Q
V
Y
Y
F
G
P
C
G
n
Y
N
A
M
V
L
E
L
L
G
P
S
L
E
D
L
F
D
L
C
D
R
T
F
T
L
K
T
V
L
M
I
A
I
Q
L
I
T
R
M
E
Y
V
H
T
K
S
L
I
Y
R
D
V
K
P
E
N
F
L
V
G
R
P
G
T
K
R
Q
H
A
I
H
I
I
D
F
G
L
A
K
E
Y
I
D
P
E
T
K
K
H
I
P
Y
R
E
H
K
S
L
T
G
T
A
R
Y
M
S
I
N
T
H
L
G
K
E
Q
S
R
R
D
D
L
E
A
L
G
H
M
F
M
Y
F
L
R
G
S
L
P
W
Q
G
L
K
A
D
T
L
K
E
R
Y
Q
K
I
G
D
T
K
R
A
T
P
I
E
V
L
C
E
N
F
P
E
E
M
A
T
Y
L
R
Y
V
R
R
L
D
F
F
E
K
P
D
Y
D
Y
L
R
K
L
F
T
D
L
F
D
R
S
G
F
V
F
D
Y
E
Y
D
W
A
G
K
P
L
P
T
P
I
G
T
V
H
T
D
L
P
S
Q
P
Q
L
R
D
K
T
Q
P
H
S
K
N
Q
A
L
N
S
T
N
G
E
L
N
A
D
D
P
T
A
G
H
S
N
A
P
I
T
A
P
A
E
V
E
V
A
D
E
T
K
C
C
C
F
F
K
R
R
K
R
K
S
L
Q
R
H
K
l
|
||
PDB constructs
|
nconf
|
nextran
|
expr_tag
|
organism
|
|
2C47_A
|
0
|
43
|
TEV_cleaved_Nterm
|
Human
|
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
s
m
G
P
N
F
R
V
G
K
K
I
G
C
G
N
F
G
E
L
R
L
G
K
N
L
Y
T
N
E
Y
V
A
I
K
L
E
P
I
K
S
R
A
P
Q
L
H
L
E
Y
R
F
Y
K
Q
L
S
A
T
E
G
V
P
Q
V
Y
Y
F
G
P
C
G
K
Y
N
A
M
V
L
E
L
L
G
P
S
L
E
D
L
F
D
L
C
D
R
T
F
T
L
K
T
V
L
M
I
A
I
Q
L
I
T
R
M
E
Y
V
H
T
K
S
L
I
Y
R
D
V
K
P
E
N
F
L
V
G
R
P
G
T
K
R
Q
H
A
I
H
I
I
D
F
G
L
A
K
E
Y
I
D
P
E
T
K
K
H
I
P
Y
R
E
H
K
S
L
T
G
T
A
R
Y
M
S
I
N
T
H
L
G
K
E
Q
S
R
R
D
D
L
E
A
L
G
H
M
F
M
Y
F
L
R
G
S
L
P
W
Q
G
L
K
A
D
T
L
K
E
R
Y
Q
K
I
G
D
T
K
R
A
T
P
I
E
V
L
C
E
N
F
P
E
E
M
A
T
Y
L
R
Y
V
R
R
L
D
F
F
E
K
P
D
Y
D
Y
L
R
K
L
F
T
D
L
F
D
R
S
G
F
V
F
D
Y
E
Y
D
W
A
G
K
P
L
P
T
P
I
G
T
V
H
T
D
L
P
S
Q
P
Q
L
R
D
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
|
2C47_C
|
0
|
43
|
TEV_cleaved_Nterm
|
Human
|
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
s
m
G
P
N
F
R
V
G
K
K
I
G
C
G
N
F
G
E
L
R
L
G
K
N
L
Y
T
N
E
Y
V
A
I
K
L
E
P
I
K
S
R
A
P
Q
L
H
L
E
Y
R
F
Y
K
Q
L
S
A
T
E
G
V
P
Q
V
Y
Y
F
G
P
C
G
K
Y
N
A
M
V
L
E
L
L
G
P
S
L
E
D
L
F
D
L
C
D
R
T
F
T
L
K
T
V
L
M
I
A
I
Q
L
I
T
R
M
E
Y
V
H
T
K
S
L
I
Y
R
D
V
K
P
E
N
F
L
V
G
R
P
G
T
K
R
Q
H
A
I
H
I
I
D
F
G
L
A
K
E
Y
I
D
P
E
T
K
K
H
I
P
Y
R
E
H
K
S
L
T
G
T
A
R
Y
M
S
I
N
T
H
L
G
K
E
Q
S
R
R
D
D
L
E
A
L
G
H
M
F
M
Y
F
L
R
G
S
L
P
W
Q
G
L
K
A
D
T
L
K
E
R
Y
Q
K
I
G
D
T
K
R
A
T
P
I
E
V
L
C
E
N
F
P
E
E
M
A
T
Y
L
R
Y
V
R
R
L
D
F
F
E
K
P
D
Y
D
Y
L
R
K
L
F
T
D
L
F
D
R
S
G
F
V
F
D
Y
E
Y
D
W
A
G
K
P
L
P
T
P
I
G
T
V
H
T
D
L
P
S
Q
P
Q
L
R
D
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
|
2C47_B
|
0
|
43
|
TEV_cleaved_Nterm
|
Human
|
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
s
m
G
P
N
F
R
V
G
K
K
I
G
C
G
N
F
G
E
L
R
L
G
K
N
L
Y
T
N
E
Y
V
A
I
K
L
E
P
I
K
S
R
A
P
Q
L
H
L
E
Y
R
F
Y
K
Q
L
S
A
T
E
G
V
P
Q
V
Y
Y
F
G
P
C
G
K
Y
N
A
M
V
L
E
L
L
G
P
S
L
E
D
L
F
D
L
C
D
R
T
F
T
L
K
T
V
L
M
I
A
I
Q
L
I
T
R
M
E
Y
V
H
T
K
S
L
I
Y
R
D
V
K
P
E
N
F
L
V
G
R
P
G
T
K
R
Q
H
A
I
H
I
I
D
F
G
L
A
K
E
Y
I
D
P
E
T
K
K
H
I
P
Y
R
E
H
K
S
L
T
G
T
A
R
Y
M
S
I
N
T
H
L
G
K
E
Q
S
R
R
D
D
L
E
A
L
G
H
M
F
M
Y
F
L
R
G
S
L
P
W
Q
G
L
K
A
D
T
L
K
E
R
Y
Q
K
I
G
D
T
K
R
A
T
P
I
E
V
L
C
E
N
F
P
E
E
M
A
T
Y
L
R
Y
V
R
R
L
D
F
F
E
K
P
D
Y
D
Y
L
R
K
L
F
T
D
L
F
D
R
S
G
F
V
F
D
Y
E
Y
D
W
A
G
K
P
L
P
T
P
I
G
T
V
H
T
D
L
P
S
Q
P
Q
L
R
D
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
|
2C47_D
|
0
|
43
|
TEV_cleaved_Nterm
|
Human
|
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
s
m
G
P
N
F
R
V
G
K
K
I
G
C
G
N
F
G
E
L
R
L
G
K
N
L
Y
T
N
E
Y
V
A
I
K
L
E
P
I
K
S
R
A
P
Q
L
H
L
E
Y
R
F
Y
K
Q
L
S
A
T
E
G
V
P
Q
V
Y
Y
F
G
P
C
G
K
Y
N
A
M
V
L
E
L
L
G
P
S
L
E
D
L
F
D
L
C
D
R
T
F
T
L
K
T
V
L
M
I
A
I
Q
L
I
T
R
M
E
Y
V
H
T
K
S
L
I
Y
R
D
V
K
P
E
N
F
L
V
G
R
P
G
T
K
R
Q
H
A
I
H
I
I
D
F
G
L
A
K
E
Y
I
D
P
E
T
K
K
H
I
P
Y
R
E
H
K
S
L
T
G
T
A
R
Y
M
S
I
N
T
H
L
G
K
E
Q
S
R
R
D
D
L
E
A
L
G
H
M
F
M
Y
F
L
R
G
S
L
P
W
Q
G
L
K
A
D
T
L
K
E
R
Y
Q
K
I
G
D
T
K
R
A
T
P
I
E
V
L
C
E
N
F
P
E
E
M
A
T
Y
L
R
Y
V
R
R
L
D
F
F
E
K
P
D
Y
D
Y
L
R
K
L
F
T
D
L
F
D
R
S
G
F
V
F
D
Y
E
Y
D
W
A
G
K
P
L
P
T
P
I
G
T
V
H
T
D
L
P
S
Q
P
Q
L
R
D
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
|