Vấn đề là nó thế này:
Trong 100% bài báo liên quan, người ta thường minh họa protein có nhiều domain này theo kiểu domain này nằm kế tiếp domain kia theo đầu N terminus đến C terminus. Nhưng annotation của protein đó thì lại có trật tự sắp xếp khác so với hình minh họa. Ngoài ra có 2 domain chồng lên nhau đến trên 95%. Blast cái trình tự này cũng ra 2 cái conserved domain families khác nhau. Như vậy thì chắc là annotation đúng. Nhưng chả hiểu sao đến giờ người ta vẫn minh họa protein này theo kiểu từng domain riêng biệt, và theo trật tự khác với annotation (không phải là ngoại lệ, mà là quy luật luôn).
Protein quan tâm là Polyketide synthase, enyzme phổ biến nhất trong quá trình sinh tổng hợp hợp chất thứ cấp ở nấm và vi khuẩn.