diff --git a/01-intro.md b/01-intro.md new file mode 100644 index 00000000..33d494e6 --- /dev/null +++ b/01-intro.md @@ -0,0 +1,158 @@ +--- +title: Introducción a la Terminal +teaching: 5 +exercises: 0 +--- + +::::::::::::::::::::::::::::::::::::::: objectives + +- Explicar cómo se relaciona la terminal con el teclado, la pantalla, el sistema operativo y los programas de los usuarios. +- Explicar cuándo y por qué se deben utilizar interfaces de línea de comandos en lugar de interfaces gráficas. + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::: questions + +- ¿Qué es una terminal y por qué utilizarla? + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +### Introducción + +En su nivel más sencillo, las computadoras hacen cuatro cosas: + +- ejecutar programas +- guardar datos +- comunicarse entre ellas +- interactuar con nosotros + +Pueden hacer estas cosas de muchas maneras distintas, +incluyendo conexiones directas entre cerebro-computadora o +interfaces de voz. +Aunque estas interfaces son cada vez más comunes, la mayoría de las interacciones aún se llevan a cabo a través de pantallas, ratones, pantallas táctiles y teclados. +A pesar de que la mayoría de los sistemas operativos modernos se comunican con sus +usuarios a través de ventanas, íconos y apuntadores, estas tecnologías no eran +comunes sino hasta los años 80s. Las raíces de estas *interfaces gráficas de usuario* +se remontan al trabajo de Doug Engelbart's en los 60s, el cual podemos ver en lo que +se ha denominado "[La Madre de todos los Demos](https://www.youtube.com/watch?v=yJDv-zdhzMY)". + +### Interfaz de Línea de Comandos + +Remontándonos aún más allá, +la única manera de interactuar con las computadoras tempranas era reorganizando +sus cables. +Después, entre los 50s y los 80s, la mayoría de la gente utilizaba impresoras de línea. +Estos aparatos solo permitían generar entradas y salidas de letras, números y signos +de puntuación que se encontraban en un teclado estándar, por lo que los lenguajes +de programación y las interfaces con el *software* tuvieron que ser diseñados con esa +limitante en mente. + +A este tipo de interfaz se le denomina **interfaz de línea de comandos** +(**command-line interface**, o CLI por sus siglas en inglés) para distinguirla de la +**interfaz gráfica de usuario** (**graphical user interface**, o GUI) que es la +que utilizan la mayoría de los usuarios actuales. +El corazón del CLI es un ciclo conocido como **read-evaluate-print loop**, o REPL +(**ciclo lectura-ejecución-impresión**): +cuando el usuario teclea un comando y después presiona la tecla Enter, +la computadora lo lee, +ejecuta +e imprime el resultado (también conocido como output). +Después el usuario escribe otro comando y el ciclo continúa hasta que el +usuario se desconecta del equipo. + +### La Terminal + +Esta descripción hace pensar que el usuario envía comandos directamente a la computadora +y que la computadora envía el resultado o salida directamente al usuario. +De hecho, +por lo general hay un programa intermediario conocido como +**terminal** o **línea de comandos**. +Lo que el usuario escribe se pasa a la terminal, +la cual calcula qué comandos ejecutar y ordena al equipo su ejecución. +(En inglés, a la terminal se le llama "shell", que quiere decir concha, porque encierra al sistema operativo +con el fin de ocultar algo de su complejidad y hacer más fácil la interacción con él.) + +Una terminal es un programa como cualquier otro. +Lo que la hace especial es que su trabajo es ejecutar otros programas, +en lugar de realizar los cálculos en sí. +La terminal más popular de Unix se llama **Bash**, que proviene de **Bourne Again Shell** +(así llamada porque deriva de una versión previa escrita por Stephen Bourne). +**Bash** es la terminal por defecto en la mayoría de las implementaciones modernas de Unix, +y en la mayoría de los paquetes que proporcionan herramientas similares a las de Unix +para Windows. + +### ¿Por qué usarlo? + +Utilizar **bash** o cualquier otra terminal +a veces es mas cómodo para programar que utilizar un ratón. +Los comandos son cortos (a menudo con sólo un par de caracteres de largo), +sus nombres son frecuentemente crípticos, +y su salida son líneas de texto en lugar de algo visual, como un gráfico. +Por otra parte, +con unas cuantas teclas la terminal nos permite combinar las herramientas existentes en +potentes **pipelines** y manejar grandes volúmenes de datos automáticamente. Esta automatización +no sólo nos hace más productivos, sino que también mejora la reproducibilidad de nuestros +trabajo dado que permite repetir procesos de forma idéntica con unos simples comandos. +Además, la línea de comandos es a menudo la forma más fácil de interactuar con máquinas remotas y superordenadores. +La familiaridad con la terminal es casi esencial para utilizar una variedad de herramientas y recursos especializados, +incluyendo sistemas de computación de alto rendimiento. +A medida que los **clusters** y los sistemas de computación en la nube se vuelven más +populares para el análisis de datos científicos, +ser capaz de interactuar con ellos se convierte en una habilidad necesaria. +Podemos aprovechar las habilidades que adquiriremos en línea de comandos +para abordar una amplia gama de preguntas científicas y desafíos computacionales. + +## Pipeline de Nelle: Punto de partida + +Nelle Nemo, una bióloga marina, +acaba de regresar de un estudio de seis meses del +[Giro del Pacífico Norte](https://en.wikipedia.org/wiki/North_Pacific_Gyre), +en donde ha estado muestreando la vida marina gelatinosa en la +[Gran Mancha de Basura del Pacífico](https://en.wikipedia.org/wiki/Great_Pacific_Garbage_Patch). +Tiene 1,520 muestras en total, ahora necesita: + +1. Procesar cada muestra en una máquina de ensayo + para medir la abundancia relativa de 300 proteínas diferentes. + La salida de la máquina para una sola muestra es + un archivo con una línea para cada proteína, y un archivo con la secuencia de cada proteína. +2. Calcular las estadísticas de cada una de las proteínas por separado + usando un programa que su supervisor escribió llamado `goostat`. +3. Comparar las estadísticas de cada proteína con las estadísticas correspondientes de las otras proteínas + utilizando un programa que escribió uno de los estudiantes de doctorado llamado `goodiff`. +4. Resumir los resultados. + A su supervisor le gustaría mucho que su análisis estuviera listo para fin de mes, + para que su artículo pueda aparecer en un próximo número especial de *Aquatic Goo Letters*. + +La máquina de ensayo tarda aproximadamente media hora en procesar cada muestra. +La buena noticia es que +sólo se necesitan dos minutos para configurar cada ensayo. +Dado que su laboratorio tiene ocho máquinas de ensayo que puede utilizar en paralelo, +este paso "sólo" durará unas dos semanas. + +La mala noticia es que si quiere ejecutar `goostat` y` goodiff` a mano, +Nelle tendrá que ingresar los nombres de los archivos y hacer clic en "Aceptar" 46,370 veces +(1520 carreras de `goostat`, más 300 \* 299/2 (la mitad de 300 veces 299) ejecuciones de` goodiff`). +Dado que cada ejecución toma 30 segundos, +le llevará más de dos semanas (sin dormir ni comer). +Nelle no sólo no cumpliría su plazo de entrega de resultados, +sino que las posibilidades de que escriba todos los comandos correctamente son prácticamente cero. + +Las siguientes lecciones explorarán una mejor alternativa para que Nelle realice su análisis. +Más específicamente, +explicaremos cómo puede usar la línea de comandos +para automatizar los pasos repetitivos en su **pipeline**. Así, su computadora podrá trabajar las 24 horas del día mientras ella escribe su artículo. +Además, +una vez que Nelle haya generado un **pipeline** +podrá usarlo de nuevo cada vez que colecte nuevos datos. + + + +:::::::::::::::::::::::::::::::::::::::: keypoints + +- Una terminal es un programa cuyo objetivo principal es leer comandos y ejecutar otros programas. +- Las principales ventajas de la terminal son su alta relación acción-tecla, su soporte para la automatización de tareas repetitivas, y que puede utilizarse para acceder a otras máquinas en una red. +- Las desventajas principales de la terminal son su naturaleza primordialmente textual y que sus comandos y operación pueden llegar a ser muy crípticos. + +:::::::::::::::::::::::::::::::::::::::::::::::::: + + diff --git a/02-filedir.md b/02-filedir.md new file mode 100644 index 00000000..f0d4a363 --- /dev/null +++ b/02-filedir.md @@ -0,0 +1,919 @@ +--- +title: Navegación de archivos y directorios +teaching: 15 +exercises: 0 +--- + +::::::::::::::::::::::::::::::::::::::: objectives + +- Explicar las similitudes y diferencias entre un archivo y un directorio. +- Convertir una ruta absoluta en una ruta relativa y viceversa. +- Construir rutas absolutas y relativas que identifican archivos y directorios específicos. +- Explicar los pasos del ciclo de lectura-ejecución-impresión de la terminal. +- Identificar el comando, opciones y nombres de archivo en una llamada de línea de comandos. +- Demostrar el uso del autocompletado con el tabulador y explicar sus ventajas. + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::: questions + +- ¿Cómo puedo moverme dentro de mi computadora? +- ¿Cómo puedo ver qué archivos y directorios tengo? +- ¿Cómo puedo especificar la ubicación de un archivo o directorio en mi computadora? + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +La parte del sistema operativo responsable de administrar archivos y directorios +se le denomina **sistema de archivos** (**file system**). Organiza nuestros +datos en archivos que contienen información, y directorios (también llamados +"carpetas"), que contienen archivos u otros directorios. + +Varios comandos se utilizan con frecuencia para crear, inspeccionar, cambiar el +nombre y eliminar archivos y directorios. Para comenzar a explorarlos, abramos +una terminal: + +::::::::::::::::::::::::::::::::::::::::: callout + +## La magia de preparación + +Si escribes el comando: `PS1='$ '` en tu terminal, seguido de presionar la +tecla 'Enter', tu ventana se verá como nuestro ejemplo en esta lección. +Esto no es necesario para continuar así que lo dejamos a tu criterio. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +```bash +$ +``` + +El signo `$` es un **prompt**, que nos muestra que la terminal está esperando +una entrada; tu terminal puede usar un carácter diferente como prompt y puede +agregar información antes de él. Al teclear comandos, ya sea a partir de estas +lecciones o de otras fuentes, no escribas el prompt (*$*), sólo los comandos +que le siguen. + +Escribe el comando `whoami`, luego presiona la tecla Enter para enviar el +comando a la terminal. La salida de este comando es el ID del usuario actual, +es decir, nos muestra como quién nos identifica la terminal: + +```bash +$ whoami +``` + +```output +nelle +``` + +Más específicamente, cuando escribimos `whoami` la terminal: + +1. encuentra un programa llamado `whoami`, +2. ejecuta ese programa, +3. muestra la salida de ese programa, luego +4. muestra un nuevo **prompt** para decirnos que está listo para más comandos. + +::::::::::::::::::::::::::::::::::::::::: callout + +## Variaciones en el username + +En esta lección, hemos utilizado el nombre de usuario `nelle` (asociado a +nuestra científica hipotética Nelle) en todos los ejemplos de entrada y +salida. Sin embargo, cuando escribas los comandos de esta lección en tu +computadora, deberías ver y usar algo diferente, específicamente, el +**username** asociado con tu cuenta de usuario en la computadora que estás +utilizando. Este **username** será la salida de `whoami`. En los ejemplos +siguientes, `nelle` siempre será reemplazado por ese **username**. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::::: callout + +## Comandos desconocidos + +Recuerda, la terminal es un programa que llama a otros programas en lugar +de realizar los cálculos ella misma. Los comandos que escribes en la terminal +deben ser los nombres de programas existentes. Si tecleas el nombre de un +programa que no existe y oprimes Enter, verás un mensaje de error similar a +este: + +```bash +$ mycommand +``` + +```error +-bash: mycommand: command not found +``` + +La terminal te dice que no puede encontrar el programa `mycommand` porque este +programa no existe en tu computadora. En este curso aprenderás varios +comandos, pero existen muchos más de los que mencionaremos. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +Averiguemos dónde estamos, ejecutando el comando `pwd` (que significa "imprime +directorio de trabajo" - "print working directory"). En cualquier momento, +nuestro **directorio actual** es nuestro directorio predeterminado, es decir, +el directorio que la computadora supone queremos ejecutar comandos a menos que +especifiquemos explícitamente otra cosa. En este caso la respuesta de la +computadora es `/Users/nelle`, el cual es el directorio de inicio de Nelle, +también conocido como su directorio **home**: + +```bash +$ pwd +``` + +```output +/Users/nelle +``` + +::::::::::::::::::::::::::::::::::::::::: callout + +## Variaciones en el Directorio de Inicio + +El directorio **home** puede lucir diferente en distintos sistemas operativos. +En Linux puede verse como `/home/nelle`, en Windows puede ser similar a +`C:\Documents and Settings\nelle` o `C:\Users\nelle` (pueden variar según la +versión de Windows que estés utilizando). En los ejemplos que siguen +utilizaremos la salida de Mac como estándar. Linux y Windows pueden variar +ligeramente, pero lucen similares en general. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +Para entender lo que es un "directorio **home**" echemos un vistazo a cómo se +organiza el sistema de archivos. Como ejemplo, discutiremos el sistema de +archivos en la computadora de nuestra científica Nelle. Después de este ejemplo, +aprenderás comandos para explorar tu propio sistema de archivos. Se parecerá a +este, pero no será exactamente idéntico. + +En la computadora de Nelle, el sistema de archivos se ve así: + +![](fig/filesystem.svg){alt='The File System'} + +En la parte superior está el **directorio raíz** o **root** que contiene todo +lo demás. Nos referimos a este directorio usando un caracter de barra `/` por +si solo; esta es la barra al inicio de `/Users/nelle`. + +Dentro de ese directorio hay otros directorios: +`bin` (que es donde se almacenan algunos programas preinstalados), +`data` (para archivos de datos diversos), +`Users` (donde se encuentran los directorios personales de los usuarios), +`tmp` (para archivos temporales que no necesitan ser almacenados a largo plazo), +etcétera. + +Sabemos que nuestro directorio actual de trabajo `/Users/nelle` se almacena +dentro de`/Users` porque `/Users` es la primera parte de su nombre. Igualmente, +sabemos que `/Users` se almacena dentro del directorio raíz`/` porque su +nombre comienza con `/`. + +::::::::::::::::::::::::::::::::::::::::: callout + +## Diagonales + +Observa que hay dos significados para el carácter `/`. Cuando aparezca antes +del nombre de archivo o directorio, se refiere al directorio **root**. Cuando +aparezca *dentro de* un nombre, es solo un separador. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +Dentro de `/Users`, encontramos un directorio para cada usuario con una cuenta +en la máquina de Nelle, sus colegas Mummy y Wolfman. + +![](fig/home-directories.svg){alt='Home Directories'} + +Los archivos de Mummy se almacenan en `/Users/imhotep`, los de Wolfman están en +`/Users/larry`, y los de Nelle en `/Users/nelle`. Dado que Nelle es el usuario +en nuestros ejemplos, es por eso que recibimos `/Users/nelle` como nuestro +directorio personal. Normalmente, cada vez que abres una nueva terminal te +encontrarás en tu directorio **home**. + +Ahora vamos a aprender el comando que nos permitirá ver el contenido de nuestro +sistema de archivos. Podemos ver lo que hay en nuestro directorio personal +ejecutando `ls`, que significa "listar": + +```bash +$ ls +``` + +```output +Applications Documents Library Music Public +Desktop Downloads Movies Pictures +``` + +(Una vez más, tus resultados pueden ser ligeramente diferentes dependiendo de +tu sistema operativo y cómo has personalizado tu sistema de archivos.) + +`ls` imprime los nombres de los archivos y directorios en el directorio actual +en orden alfabético, dispuestos ordenadamente en columnas. Podemos hacer su +salida más comprensible usando la opción o **flag** `-F`, que le indica a `ls` +que agregue un `/`a los nombres de los directorios: + +```bash +$ ls -F +``` + +```output +Applications/ Documents/ Library/ Music/ Public/ +Desktop/ Downloads/ Movies/ Pictures/ +``` + +`ls` permite muchas otras **flags**. Para averiguar cuales son, podemos escribir: + +```bash +$ ls --help +``` + +```output +Usage: ls [OPTION]... [FILE]... +List information about the FILEs (the current directory by default). +Sort entries alphabetically if none of -cftuvSUX nor --sort is specified. + +Mandatory arguments to long options are mandatory for short options too. + -a, --all do not ignore entries starting with . + -A, --almost-all do not list implied . and .. + --author with -l, print the author of each file + -b, --escape print C-style escapes for nongraphic characters + --block-size=SIZE scale sizes by SIZE before printing them; e.g., + '--block-size=M' prints sizes in units of + 1,048,576 bytes; see SIZE format below + -B, --ignore-backups do not list implied entries ending with ~ + -c with -lt: sort by, and show, ctime (time of last + modification of file status information); + with -l: show ctime and sort by name; + otherwise: sort by ctime, newest first + -C list entries by columns + --color[=WHEN] colorize the output; WHEN can be 'always' (default + if omitted), 'auto', or 'never'; more info below + -d, --directory list directories themselves, not their contents + -D, --dired generate output designed for Emacs' dired mode + -f do not sort, enable -aU, disable -ls --color + -F, --classify append indicator (one of */=>@|) to entries + --file-type likewise, except do not append '*' + --format=WORD across -x, commas -m, horizontal -x, long -l, + single-column -1, verbose -l, vertical -C + --full-time like -l --time-style=full-iso + -g like -l, but do not list owner + --group-directories-first + group directories before files; + can be augmented with a --sort option, but any + use of --sort=none (-U) disables grouping + -G, --no-group in a long listing, don't print group names + -h, --human-readable with -l and/or -s, print human readable sizes + (e.g., 1K 234M 2G) + --si likewise, but use powers of 1000 not 1024 + -H, --dereference-command-line + follow symbolic links listed on the command line + --dereference-command-line-symlink-to-dir + follow each command line symbolic link + that points to a directory + --hide=PATTERN do not list implied entries matching shell PATTERN + (overridden by -a or -A) + --indicator-style=WORD append indicator with style WORD to entry names: + none (default), slash (-p), + file-type (--file-type), classify (-F) + -i, --inode print the index number of each file + -I, --ignore=PATTERN do not list implied entries matching shell PATTERN + -k, --kibibytes default to 1024-byte blocks for disk usage + -l use a long listing format + -L, --dereference when showing file information for a symbolic + link, show information for the file the link + references rather than for the link itself + -m fill width with a comma separated list of entries + -n, --numeric-uid-gid like -l, but list numeric user and group IDs + -N, --literal print raw entry names (don't treat e.g. control + characters specially) + -o like -l, but do not list group information + -p, --indicator-style=slash + append / indicator to directories + -q, --hide-control-chars print ? instead of nongraphic characters + --show-control-chars show nongraphic characters as-is (the default, + unless program is 'ls' and output is a terminal) + -Q, --quote-name enclose entry names in double quotes + --quoting-style=WORD use quoting style WORD for entry names: + literal, locale, shell, shell-always, + shell-escape, shell-escape-always, c, escape + -r, --reverse reverse order while sorting + -R, --recursive list subdirectories recursively + -s, --size print the allocated size of each file, in blocks + -S sort by file size, largest first + --sort=WORD sort by WORD instead of name: none (-U), size (-S), + time (-t), version (-v), extension (-X) + --time=WORD with -l, show time as WORD instead of default + modification time: atime or access or use (-u); + ctime or status (-c); also use specified time + as sort key if --sort=time (newest first) + --time-style=STYLE with -l, show times using style STYLE: + full-iso, long-iso, iso, locale, or +FORMAT; + FORMAT is interpreted like in 'date'; if FORMAT + is FORMAT1FORMAT2, then FORMAT1 applies + to non-recent files and FORMAT2 to recent files; + if STYLE is prefixed with 'posix-', STYLE + takes effect only outside the POSIX locale + -t sort by modification time, newest first + -T, --tabsize=COLS assume tab stops at each COLS instead of 8 + -u with -lt: sort by, and show, access time; + with -l: show access time and sort by name; + otherwise: sort by access time, newest first + -U do not sort; list entries in directory order + -v natural sort of (version) numbers within text + -w, --width=COLS set output width to COLS. 0 means no limit + -x list entries by lines instead of by columns + -X sort alphabetically by entry extension + -Z, --context print any security context of each file + -1 list one file per line. Avoid '\n' with -q or -b + --help display this help and exit + --version output version information and exit + +The SIZE argument is an integer and optional unit (example: 10K is 10*1024). +Units are K,M,G,T,P,E,Z,Y (powers of 1024) or KB,MB,... (powers of 1000). + +Using color to distinguish file types is disabled both by default and +with --color=never. With --color=auto, ls emits color codes only when +standard output is connected to a terminal. The LS_COLORS environment +variable can change the settings. Use the dircolors command to set it. + +Exit status: + 0 if OK, + 1 if minor problems (e.g., cannot access subdirectory), + 2 if serious trouble (e.g., cannot access command-line argument). + +GNU coreutils online help: +Full documentation at: +or available locally via: info '(coreutils) ls invocation' +``` + +Muchos comandos bash y programas que la gente ha escrito que se pueden +ejecutar desde el bash, aceptan la opción `--help` para mostrar más +información sobre cómo usar los comandos o programas. + +::::::::::::::::::::::::::::::::::::::::: callout + +## Opciones de línea de comandos inexistentes + +Si intentas utilizar una **flag** que no existe, `ls` y otros programas +imprimirán un mensaje de error similar a este: + +```bash +$ ls -j +``` + +```error +ls: invalid option -- 'j' +Try 'ls --help' for more information. +``` + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +Para más información sobre cómo usar `ls` podemos escribir `man ls`. `man` es +el comando "manual" de Unix: imprime la descripción de un comando y sus +opciones, y (si tienes suerte) proporciona algunos ejemplos de cómo usarlo. + +::::::::::::::::::::::::::::::::::::::::: callout + +## `man` y Git para Windows + +La terminal proporcionada por Git para Windows no incluye soporte para el +comando `man`. Una búsqueda en la web de `unix man page COMMAND` (por +ejemplo, `unix man page grep`) proporciona enlaces a numerosas copias en +línea del manual de Unix. Por ejemplo, GNU proporciona enlaces a sus +[Manuales](https://www.gnu.org/manual/manual.html), que incluyen +[grep](https://www.gnu.org/software/grep/manual/), y +[utilidades básicas de GNU](https://www.gnu.org/software/coreutils/manual/coreutils.html), +que cubre muchos comandos incluidos en esta lección. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +Para navegar por las páginas de `man`, las teclas de flecha arriba y abajo te +permiten moverte línea por línea, las teclas "b" y la barra espaciadora permiten +saltar hacia arriba y hacia abajo una página a la vez. Puedes salir de las +páginas `man` escribiendo "q". + +Aquí podemos ver que nuestro directorio **home** contiene principalmente +**subdirectorios**. Cualquier nombre en la salida que no tenga barras se refiere +a **archivos** comunes y corrientes. Observa que hay un espacio entre `ls` y +`-F`: sin él, la terminal cree que estamos tratando de ejecutar un comando +llamado `ls-F`, el cual no existe. + +::::::::::::::::::::::::::::::::::::::::: callout + +## Parámetros vs. Argumentos + +De acuerdo con [Wikipedia](https://en.wikipedia.org/wiki/Parameter_\(computer_programming\)#Parameters_and_arguments), +los términos **argumento** y **parámetro** significan cosas ligeramente +diferentes. En la práctica, sin embargo, la mayoría de la gente los usa +indistintamente para referirse a los términos que acompañan a un comando. +Considera el siguiente ejemplo: + +```bash +$ ls -lh Documents +``` + +`ls` es el comando, `-lh` son **flags** (u opciones), y `Documents` +es el argumento. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +También podemos usar `ls` para ver el contenido de un directorio diferente. +Veamos nuestro directorio `Desktop` ejecutando` ls -F Desktop`, es decir, +el comando `ls` con **flag** `-F` y el **argumento** `Desktop`. El argumento +`Desktop` le dice a `ls` que queremos una lista de algo distinto a nuestro +directorio actual. + +```bash +$ ls -F Desktop +``` + +```output +data-shell/ +``` + +La salida debe ser una lista de todos los archivos y subdirectorios en tu +**Desktop**, incluido el directorio `data-shell` que descargaste al comienzo de +la lección. Echa un vistazo a tu escritorio para confirmar que la salida es +correcta. + +Como puedes ver ahora, el uso de una terminal está basado de la idea de que tus +archivos se organizan en un sistema de archivos jerárquico. Organizar las cosas +jerárquicamente nos ayuda a realizar un seguimiento de nuestro trabajo: es +posible poner centenares de archivos en nuestro directorio **home**, así como es +posible acumular cientos de papeles impresos en nuestro escritorio, pero es una +estrategia muy poco eficiente. + +Ahora que sabemos que el directorio `data-shell` se encuentra en `Desktop`, +podemos hacer dos cosas. + +Primero, podemos ver su contenido, usando la misma estrategia que antes, +pasando un nombre de directorio a `ls`: + +```bash +$ ls -F Desktop/data-shell +``` + +```output +creatures/ molecules/ notes.txt solar.pdf +data/ north-pacific-gyre/ pizza.cfg writing/ +``` + +En segundo lugar, podemos cambiar nuestra ubicación a un directorio diferente, +por lo que ya no estaremos ubicados en nuestro directorio **home**. + +El comando para cambiar de ubicación es `cd`, seguido del nombre de un +directorio para cambiar nuestro directorio de trabajo. `cd` significa "cambio +de directorio" (change directory), lo cual es un poco engañoso: el comando no +cambia el directorio, cambia la idea de la terminal de en qué directorio estamos. + +Digamos que queremos pasar al directorio `data` que vimos anteriormente. +Podemos utilizar la siguiente serie de comandos para llegar allí: + +```bash +$ cd Desktop +$ cd data-shell +$ cd data +``` + +Estos comandos nos moverán del directorio **home** al directorio Desktop, luego +al directorio `data-shell`, y finalmente al directorio `data`. `cd` no imprime +nada, pero si ejecutamos `pwd` después de esto, podemos ver que ahora estamos en +`/Users/nelle/Desktop/data-shell/data`. Si ejecutamos `ls` ahora sin argumentos, +se listan los contenidos de `/Users/nelle/Desktop/data-shell/data`, porque ahí +es donde estamos ahora: + +```bash +$ pwd +``` + +```output +/Users/nelle/Desktop/data-shell/data +``` + +```bash +$ ls -F +``` + +```output +amino-acids.txt elements/ pdb/ salmon.txt +animals.txt morse.txt planets.txt sunspot.txt +``` + +Ahora sabemos cómo bajar por el árbol de directorios, pero ¿cómo subimos +(regresamos)? Podemos probar lo siguiente: + +```bash +cd data-shell +``` + +```error +-bash: cd: data-shell: No such file or directory +``` + +¡Pero tenemos un error! ¿Por qué pasa esto? + +Con los métodos aprendidos hasta ahora, `cd` sólo puede ver subdirectorios +dentro del directorio actual. Existen distintas maneras de ver los directorios +que se encuentran encima de tu ubicación actual; empezaremos con el más simple. + +Existe un acceso directo en la terminal para subir un nivel de directorio que +se ve así: + +```bash +$ cd .. +``` + +`..` es un nombre de directorio especial que significa "el directorio que +contiene a este", o más brevemente, el **padre** del directorio actual. Por +supuesto, si ejecutamos `pwd` después de ejecutar` cd ..`, volvemos a +`/Users/nelle/Desktop/data-shell`: + +```bash +$ pwd +``` + +```output +/Users/nelle/Desktop/data-shell +``` + +Normalmente no aparece el directorio especial `..` cuando ejecutamos` ls`. Si +queremos mostrarlo, podemos dar a `ls` la opción `-a`: + +```bash +$ ls -F -a +``` + +```output +./ creatures/ notes.txt +../ data/ pizza.cfg +.bash_profile molecules/ solar.pdf +Desktop/ north-pacific-gyre/ writing/ +``` + +`-a` significa "mostrar todo"; obliga a `ls` a mostrarnos nombres de archivos y +directorios que comienzan con `.`, como `..` (que, si estamos en` /Users/nelle`, +hace referencia al directorio `/Users`) Como puedes ver, también muestra otro +directorio especial que se llama simplemente `.`, que significa "el directorio +de trabajo actual". Puede parecer redundante tener un nombre para él, pero +veremos algunos usos para ello en el transcurso de este curso. + +Nota que varias **flags** del mismo comando pueden combinarse en el mismo `-`, +sin espacios entre los argumentos: `ls -F -a` es equivalente a `ls -Fa`. + +::::::::::::::::::::::::::::::::::::::::: callout + +## Otros archivos ocultos + +Además de los directorios ocultos `..` y `.`, también puedes ver un archivo +llamado `.bash_profile`. Este archivo normalmente contiene configuraciones +de ajuste de la terminal. También puedes ver otros archivos y directorios que +comienzan con `.`. Estos son generalmente archivos y directorios que se +utilizan para configurar diferentes programas en tu computadora. El prefijo +`.` se utiliza para evitar que archivos de configuración llenen la terminal +cuando un comando `ls` estándar se utiliza. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::::: callout + +## Ortogonalidad + +Los nombres especiales `.` y `..` no son exclusivos de `cd`; son interpretados +de la misma manera por todos los programas. Por ejemplo, si estamos en +`/Users/nelle/data`, el comando `ls ..` nos dará una lista de`/Users/nelle`. +Cuando los significados de las partes son los mismos, no importa cómo se +combinan, los programadores dicen que son **ortogonales**: los sistemas +ortogonales tienden a ser más fáciles de aprender porque hay menos casos +especiales y excepciones que recordar. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +Estos son entonces los comandos básicos para navegar por el sistema de archivos +de tu computadora: `pwd`,` ls` y `cd`. Exploremos algunas variaciones de estos +comandos. ¿Qué pasa si escribes `cd` por sí solo, sin dar un directorio? + +```bash +$ cd +``` + +¿Cómo puedes comprobar lo que sucedió? ¡`pwd` nos da la respuesta! + +```bash +$ pwd +``` + +```output +/Users/nelle +``` + +Resulta que `cd` sin un argumento te devolverá a tu directorio **home**, lo +cual es genial si te has perdido en tu propio sistema de archivos. + +Vamos a intentar volver al directorio `data` que utilizamos antes. La última +vez, usamos tres comandos, pero en realidad podemos enlazar la lista de +directorios para llegar a `data` en un solo paso: + +```bash +$ cd Desktop/data-shell/data +``` + +Comprueba que nos hemos movido al lugar correcto ejecutando `pwd` y `ls -F`. + +Si queremos subir un nivel desde el directorio de datos, podríamos usar +`cd ..`. Pero hay otra manera de moverse a cualquier directorio, +independientemente de tu ubicación actual. + +Hasta ahora, al especificar nombres de directorio, o incluso una ruta de +directorio (como anteriormente), hemos estado usando **caminos relativos**. +Cuando utilizas una ruta relativa con un comando como `ls` o` cd`, la terminal +intenta encontrar esa ubicación desde donde estamos, en lugar de la raíz del +sistema de archivos. + +Sin embargo, es posible especificar la **ruta absoluta** a un directorio +incluyendo su ruta completa desde el directorio raíz, que está indicado por una +diagonal principal. Esta `/` principal le dice a la computadora que siga el +camino desde la raíz del sistema de archivos, por lo que siempre se refiere a un +sólo directorio, sin importar donde estemos cuando ejecutamos el comando. + +Esto nos permite pasar a nuestro directorio `data-shell` desde cualquier lugar +del sistema de directorios (incluyendo desde `data`). Para encontrar el camino +absoluto que estamos buscando, podemos usar `pwd` y luego extraer la pieza que +necesitamos para movernos a `data-shell`. + +```bash +$ pwd +``` + +```output +/Users/nelle/Desktop/data-shell/data +``` + +```bash +$ cd /Users/nelle/Desktop/data-shell +``` + +Ejecuta `pwd` y `ls -F` para asegurarte de que estás en el directorio que +esperas. + +::::::::::::::::::::::::::::::::::::::::: callout + +## Dos atajos más + +La terminal interpreta el carácter `~` (tilde) al inicio de una ruta como +"el directorio inicial del usuario actual". Por ejemplo, si el **home** de +Nelle es `/Users/nelle`, entonces` ~/data` es equivalente a +`/Users/nelle/data`. Esto sólo funciona si es el primer carácter en la ruta: +`aqui/alla/~/otrolado` *no* es `aquí/alla/Users/nelle/otrolado`. + +Otro atajo es el carácter `-` (guión). `cd` lo interpreta como *el directorio +anterior en el que estaba*, lo cual es más rápido que tener que recordar, +y luego escribir, la ruta completa. Esta es una manera *muy* eficiente de ir +y venir entre directorios. La diferencia entre `cd ..` y `cd -` es que el +primero te mueva hacia *adelante*, mientras que el último te *regresa*. Puedes +pensar en ello como el botón *último canal* en el control remoto de tu +televisión. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +### Pipeline de Nelle: Organizando archivos + +Sabiendo todo esto de archivos y directorios, Nelle está lista para organizar +los archivos que creará la máquina de análisis de proteínas. Primero, Nelle crea +un directorio llamado `north-pacific-gyre` (para recordar de dónde provienen los +datos). Dentro de éste, crea un directorio llamado `2012-07-03`, que es la fecha +en que comenzó a procesar las muestras. Solía utilizar nombres como +`conference-paper` y `revised-results`, pero se tornaban difíciles de entender +después de un par de años. (La gota que derramo el vaso fue cuando se encontró +creando un directorio denominado `revised-revised-results-3`.) + +::::::::::::::::::::::::::::::::::::::::: callout + +## Ordenando la salida + +Nelle nombra sus directorios "año-mes-día", con ceros a la cabeza para meses +y días, porque la terminal muestra los nombres de archivos y directorios en +orden alfabético. Si usara nombres de mes, diciembre vendría antes de julio; +si no utiliza ceros a la izquierda, Noviembre ('11') vendría antes de julio +('7'). Del mismo modo, poner el año primero significa que junio de 2012 +aparecerá antes de junio de 2013. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +Cada una de sus muestras físicas está etiquetada según la convención de su +laboratorio con un identificador único de diez caracteres, tal como "NENE01729A". +Esto es lo que utilizó en su registro de la colección para registrar la +ubicación, el tiempo, la profundidad y otras características de la muestra, por +lo que decidió utilizarlo como parte del nombre de cada archivo de datos. Dado +que la salida de la máquina de ensayo es texto sin formato, ella llamará a sus +archivos `NENE01729A.txt`, `NENE01812A.txt`, y así sucesivamente. Todos los +1,520 archivos estarán en el mismo directorio. + +Ahora en su directorio actual `data-shell`, Nelle puede ver qué archivos tiene +usando el comando: + +```bash +$ ls north-pacific-gyre/2012-07-03/ +``` + +Esto es mucho que teclear, pero puede permitir que la terminal haga la mayor +parte del trabajo a través de lo que se llama **autocompletado con el +tabulador**. Si escribe: + +```bash +$ ls nor +``` + +y después presiona el tabulador (la tecla de tabulador en su teclado), la +terminal completa automáticamente el nombre del directorio por ella: + +```bash +$ ls north-pacific-gyre/ +``` + +Si presiona el tabulador otra vez, Bash añadirá `2012-07-03/` al comando, ya +que es el único autocompletamiento posible. Presionar el tabulador de nuevo no +hace nada, ya que hay 19 posibilidades; presionar el tabulador dos veces muestra +una lista de todos los archivos, y así sucesivamente. Esto se denomina +**autocompletado con el tabulador**, y lo veremos en muchas otras herramientas a +medida que avancemos. + +::::::::::::::::::::::::::::::::::::::: challenge + +## Rutas Absolutas vs Relativas + +A partir de `/Users/amanda/data/`, ¿Cuál de los siguientes comandos podría +Amanda usar para navegar a su directorio de inicio, que es `/Users/amanda`? + +1. `cd .` +2. `cd /` +3. `cd /home/amanda` +4. `cd ../..` +5. `cd ~` +6. `cd home` +7. `cd ~/data/..` +8. `cd` +9. `cd ..` + +::::::::::::::: solution + +## Solución + +1. No: `.` significa el directorio actual. +2. No: `/` significa el directorio raíz. +3. No: El directorio **home** de Amanda es `/Users/amanda`. +4. No: sube dos niveles, es decir termina en `/Users`. +5. Sí: `~` significa el directorio **home** del usuario, en este caso + `/Users/amanda`. +6. No: esto navegaría a un directorio `home` en el directorio actual, si + existe. +7. Sí: innecesariamente complicado, pero correcto. +8. Sí: un atajo para volver al directorio **home** del usuario. +9. Sí: sube un nivel. + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Resolución de ruta relativa + +Si se utiliza el diagrama de sistema de directorios de abajo, si `pwd` muestra +`/Users/thing`, ¿Qué mostrará `ls -F ../backup`? + +1. `../backup: No such file or directory` +2. `2012-12-01 2013-01-08 2013-01-27` +3. `2012-12-01/ 2013-01-08/ 2013-01-27/` +4. `original/ pnas_final/ pnas_sub/` + +![](fig/filesystem-challenge.svg){alt='Sistema de archivos para las preguntas del desafío'} + +::::::::::::::: solution + +## Solución + +1. No: sí existe un directorio `backup` en `/Users`. +2. No: este es el contenido de `Users/thing/backup`, + pero con `..` pedimos un nivel más arriba. +3. No: lee la explicación anterior. +4. Sí: `../backup` se refiere a `/Users/backup`. + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## `ls` comprensión de lectura + +Suponiendo una estructura de directorio como en la figura anterior, si `pwd` +muestra `/Users/backup`, y `-r` le dice a `ls` que muestre el resultado en +orden inverso, ¿qué comando mostrará: + +```output +pnas_sub/ pnas_final/ original/ +``` + +1. `ls pwd` +2. `ls -r -F` +3. `ls -r -F /Users/backup` +4. \#2 y #3, pero no #1. + +::::::::::::::: solution + +## Solution + +1. No: `pwd` no es el nombre de un directorio. +2. Sí: `ls` sin argumento de directorio lista archivos y directorios en el + directorio actual. +3. Sí: utiliza explícitamente el camino absoluto. +4. Correcto: vea las explicaciones arriba. + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Explorando más argumentos de `ls` + +¿Qué hace el comando `ls` cuando se utiliza con los argumentos` -l` y `-h`? + +Algunos de sus resultados son sobre propiedades que no cubrimos en esta +lección (tales como permisos de archivo y propiedad), sin embargo, el resto +debe ser útil. + +::::::::::::::: solution + +## Solución + +El argumento `-l` hace que `ls` utilice un formato de lista **l**argo, +mostrando no sólo los nombres de archivo/directorio, sino también información +adicional como el tamaño del archivo y la hora de su última modificación. El +argumento `-h` hace que el tamaño del archivo sea "**h**uman readable" +(legible por humanos), es decir, muestra algo como `5.3K` en lugar de` 5369`. + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Listando recursivamente y por tiempo + +El comando `ls -R` enumera el contenido de los directorios recursivamente, es +decir, lista sus subdirectorios, subsubdirectorios, etc. en orden alfabético +en cada nivel. El comando `ls -t` ordena el resultado según la fecha del +último cambio, los archivos o directorios más recientemente modificados +aparecen primero. ¿En qué orden muestra los resultados el usar `ls -R -t`? +Pista: `ls -l` usa un formato de lista larga para ver los **timestamps**. + +::::::::::::::: solution + +## Solución + +Los directorios se enlistan alfabéticamente en cada nivel, los +archivos/directorios en cada directorio se ordenan por la hora del último +cambio. + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + + + +:::::::::::::::::::::::::::::::::::::::: keypoints + +- El sistema de archivos es responsable de administrar la información en el disco. +- La información se almacena en archivos, que a su vez se almacenan en directorios (carpetas). +- Los directorios también pueden almacenar otros directorios, formando un árbol de directorios. +- `cd path` cambia el directorio de trabajo actual. +- `ls path` imprime un listado de un archivo o directorio específico; `ls` por si solo lista el contenido del directorio de trabajo actual. +- `pwd` imprime el directorio de trabajo actual del usuario. +- `whoami` muestra la identidad actual del usuario. +- `/` es el directorio raíz de todo el sistema de archivos. +- Una ruta relativa especifica una ubicación desde la ubicación actual. +- Una ruta absoluta especifica una ubicación desde la raíz del sistema de archivos. +- Los nombres de directorio en una ruta están separados por '/' en Unix, pero por \\ en Windows. +- '..' significa 'el directorio por encima del actual'; '.' significa 'el directorio actual'. +- La mayoría de los nombres de los archivos son `algo.extension`. La extensión no es necesaria y no garantiza nada, pero normalmente se utiliza para indicar el tipo de datos en el archivo. +- La mayoría de los comandos toman opciones (**flags**) que comienzan con un '-'. + +:::::::::::::::::::::::::::::::::::::::::::::::::: + + diff --git a/03-create.md b/03-create.md new file mode 100644 index 00000000..6018c17c --- /dev/null +++ b/03-create.md @@ -0,0 +1,793 @@ +--- +title: Trabajando con archivos y directorios +teaching: 15 +exercises: 0 +--- + +::::::::::::::::::::::::::::::::::::::: objectives + +- Crear una jerarquía de directorios que coincida con un diagrama dado. +- Crear archivos en esa jerarquía usando un editor o copiando y renombrando archivos existentes. +- Mostrar el contenido de un directorio utilizando la línea de comandos. +- Eliminar archivos y/o directorios específicos. + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::: questions + +- ¿Cómo puedo crear, copiar y eliminar archivos y directorios? +- ¿Cómo puedo editar archivos? + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +Ahora sabemos cómo explorar archivos y directorios, +pero ¿cómo los creamos en primer lugar? +Volvamos a nuestro directorio `data-shell` en Desktop +y utilicemos el comando `ls -F` para ver lo que contiene: + +```bash +$ pwd +``` + +```output +/Users/nelle/Desktop/data-shell +``` + +```bash +$ ls -F +``` + +```output +creatures/ molecules/ pizza.cfg +data/ north-pacific-gyre/ solar.pdf +Desktop/ notes.txt writing/ +``` + +Creemos un nuevo directorio llamado `thesis` usando el comando` mkdir thesis` +(que no genera una salida): + +```bash +$ mkdir thesis +``` + +Como su nombre sugiere, +`mkdir` significa "make directory", +que significa "crear directorio" en inglés. +Dado que `thesis` es una ruta relativa +(es decir, no inicia con una barra oblicua `/`), +el nuevo directorio se crea en la carpeta de trabajo actual: + +```bash +$ ls -F +``` + +```output +creatures/ north-pacific-gyre/ thesis/ +data/ notes.txt writing/ +Desktop/ pizza.cfg +molecules/ solar.pdf +``` + +::::::::::::::::::::::::::::::::::::::::: callout + +## Dos maneras de hacer lo mismo + +Usar la terminal para crear un directorio no es diferente de usar un navegador de archivos gráfico. +Si abres el directorio actual utilizando el explorador de archivos gráfico de tu sistema operativo, +el directorio `thesis` aparecerá allí también. +Si bien son dos formas diferentes de interactuar con los archivos, +los archivos y los directorios con los que trabajamos son los mismos. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::::: callout + +## Buena nomenclatura para archivos y directorios + +Usar nombres complicados para archivos y directorios pueden hacer tu vida muy complicada cuando se trabaja en la línea de comandos. Te ofrecemos algunos +consejos útiles para nombrar tus archivos de ahora en adelante. + +1. No uses espacios en blanco. + +Los espacios en blanco pueden hacer un nombre más significativo, pero, dado que se utilizan para separar argumentos en la línea de comandos, es mejor evitarlos en nombres de archivos y directorios. +Puedes utilizar `-` o` _` en lugar de espacios en blanco. + +2. No comiences el nombre con un `-` (guión). + +Los comandos tratan a los nombres que comienzan con `-` como opciones. + +3. Utiliza únicamente letras, números, `.` (punto),` -` (guión) y `_` (guión bajo). + +Muchos otros caracteres tienen un significado especial en la línea de comandos +y los aprenderemos durante esta lección. Algunos sólo harán que tu comando no funcione, otros pueden incluso hacer que pierdas datos. + +Si necesitas referirte a nombres de archivos o directorios que tengan espacios en blanco +u otro carácter no alfanumérico, se debe poner el nombre entre comillas dobles (`""`). + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +Dado que acabamos de crear el directorio `thesis`, aún se encuentra vacío: + +```bash +$ ls -F thesis +``` + +Cambiemos nuestro directorio de trabajo a `thesis` usando` cd`, +y a continuación, ejecutemos un editor de texto llamado Nano para crear un archivo denominado `draft.txt`: + +```bash +$ cd thesis +$ nano draft.txt +``` + +::::::::::::::::::::::::::::::::::::::::: callout + +## ¿Qué editor usar? + +Cuando decimos, "`nano` es un editor de texto", realmente queremos decir "texto": +sólo funciona con datos de caracteres simples, no con tablas, imágenes o cualquier otro +formato amigable con el usuario. Lo utilizamos en ejemplos porque es un editor muy sencillo que permite funciones muy básicas. Sin embargo, por estas mismas cualidades, podría ser insuficiente para necesidades de la vida real. En los sistemas Unix (como Linux y Mac OS X) +muchos programadores utilizan [Emacs](https://www.gnu.org/software/emacs/) o +[Vim](https://www.vim.org/) (ambos requieren más tiempo para familiarizarse con ellos), o un editor gráfico como +[Gedit](https://projects.gnome.org/gedit/). En Windows puedes +utilizar [Notepad ++](https://notepad-plus-plus.org/). Windows también tiene un editor +interno llamado `notepad` que se puede ejecutar desde la línea de comandos de la misma +manera que `nano` para los propósitos de esta lección. + +Sea cual sea el editor que uses, necesitarás saber dónde busca +y guarda archivos. Si lo inicias desde la terminal, usará (probablemente) +el directorio de trabajo actual como ubicación predeterminada. Si utilizas +el menú de inicio de tu computadora puede ser que los archivos se guarden en tu **Desktop** o el +directorio de Documentos. Puedes cambiar de directorio destino navegando a +otro directorio la primera vez guardes el archivo usando "Guardar como ...". + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +Escribamos algunas líneas de texto. +Una vez que estemos contentos con nuestro texto, podemos presionar `Ctrl-O` (presiona la tecla Ctrl o Control y, mientras +la mantienes presionada, oprime la tecla O) para escribir nuestros datos en el disco +(se nos preguntará en qué archivo queremos guardar esto: +presiona `Enter` para aceptar el valor predeterminado sugerido `draft.txt`). + +![](fig/nano-screenshot.png){alt='Nano in Action'} + +Una vez que nuestro archivo está guardado, podemos usar `Ctrl-X` para salir del editor y volver a la terminal. + +::::::::::::::::::::::::::::::::::::::::: callout + +## Tecla Control, Ctrl o ^ + +La tecla Control también se denomina tecla "Ctrl". Hay varias maneras +de indicar el uso de la tecla Control. Por ejemplo, +una instrucción para presionar la tecla Control y, mientras la mantienes pulsada, +presionar la tecla X, puede ser descrita de cualquiera de las siguientes maneras: + +- `Control-X` +- `Control+X` +- `Ctrl-X` +- `Ctrl+X` +- `^X` +- `C-x` + +En nano, a lo largo de la parte inferior de la pantalla se lee `^G Get Help ^O WriteOut`. +Esto significa que puedes usar `Control-G` para obtener ayuda y` Control-O` para guardar tu +archivo. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +`nano` no deja ninguna salida en la pantalla después de que salir del programa, +pero `ls` ahora muestra que hemos creado un archivo llamado` draft.txt`: + +```bash +$ ls +``` + +```output +draft.txt +``` + +Limpiemos un poco ejecutando `rm draft.txt`: + +```bash +$ rm draft.txt +``` + +Este comando elimina archivos (`rm` es la abreviatura de "remove", "remover" en inglés). +Si ejecutamos `ls` de nuevo, +la salida estará vacía una vez más, +indicándonos que nuestro archivo ha desaparecido: + +```bash +$ ls +``` + +::::::::::::::::::::::::::::::::::::::::: callout + +## Eliminar es para siempre + +La terminal de Unix no tiene una papelera de reciclaje desde donde podamos restaurar archivos +eliminados (aunque la mayoría de las interfaces gráficas de Unix sí lo tienen). En su lugar, +cuando eliminamos archivos, los mismos se desvinculan del sistema de archivos para que +su espacio de almacenamiento en disco pueda ser reciclado. Existen herramientas para encontrar y +recuperar archivos eliminados, pero no hay garantía de que +funcionen en todas las situaciones, ya que la computadora puede reciclar +el espacio en disco del archivo en cuestión inmediatamente, perdiéndose de manera permanente. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +Creemos de nuevo el archivo +y después subamos un directorio a `/Users/nelle/Desktop/data-shell` usando `cd ..`: + +```bash +$ pwd +``` + +```output +/Users/nelle/Desktop/data-shell/thesis +``` + +```bash +$ nano draft.txt +$ ls +``` + +```output +draft.txt +``` + +```bash +$ cd .. +``` + +Si tratamos de eliminar todo el directorio `thesis` usando `rm thesis`, +obtenemos un mensaje de error: + +```bash +$ rm thesis +``` + +```error +rm: cannot remove `thesis': Is a directory +``` + +Esto ocurre porque `rm` normalmente trabaja sólo con archivos, no con directorios. + +Para realmente deshacernos de `thesis` también debemos eliminar el archivo `draft.txt`. +Podemos hacer esto con la opción [recursiva](https://en.wikipedia.org/wiki/Recursion) para `rm`: + +```bash +$ rm -r thesis +``` + +::::::::::::::::::::::::::::::::::::::::: callout + +## Un gran poder conlleva una gran responsabilidad + +Eliminar los archivos en un directorio recursivamente puede ser una operación +muy peligrosa. Si nos preocupa lo que podríamos eliminar, podemos +añadir la opción "interactiva" `-i` a `rm`, que nos pedirá confirmar cada paso. + +```bash +$ rm -r -i thesis +rm: descend into directory ‘thesis'? y +rm: remove regular file ‘thesis/draft.txt'? y +rm: remove directory ‘thesis'? y +``` + +Esto elimina todo el contenido en el directorio y después el directorio mismo, preguntando +en cada paso para que se confirme la eliminación. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +Vamos a crear el directorio y el archivo una vez más. +(Ten en cuenta que esta vez estamos ejecutando `nano` con la ruta de acceso `thesis/draft.txt`, +en lugar de ir al directorio `thesis` y ejecutar `nano` en `draft.txt`.) + +```bash +$ pwd +``` + +```output +/Users/nelle/Desktop/data-shell +``` + +```bash +$ mkdir thesis +$ nano thesis/draft.txt +$ ls thesis +``` + +```output +draft.txt +``` + +`draft.txt` no es un nombre particularmente informativo, +así que cambiemos el nombre del archivo usando el comando `mv`, +que es la abreviatura de "move" (mover): + +```bash +$ mv thesis/draft.txt thesis/quotes.txt +``` + +El primer parámetro dice a `mv` lo que estamos "moviendo"", +mientras que el segundo indica a dónde hay que moverlo. +En este caso +estamos moviendo `thesis/draft.txt` a `thesis/quotes.txt`, +que tiene el mismo efecto que cambiar el nombre del archivo. +Como esperamos, +`ls` nos muestra que `thesis` ahora contiene un archivo llamado `quotes.txt`: + +```bash +$ ls thesis +``` + +```output +quotes.txt +``` + +Hay que tener cuidado al especificar el nombre del archivo destino, ya que `mv` +remplaza silenciosamente cualquier archivo existente con el mismo nombre, +provocando pérdida de datos. Un indicador adicional, `mv -i` (o `mv --interactive`), +se puede utilizar para hacer que `mv` te pida confirmación antes de sobrescribir. + +Sólo por el gusto de la consistencia, +`mv` también funciona en directorios, es decir, no existe un comando separado `mvdir`. +Vamos a mover `quotes.txt` al directorio de trabajo actual. +Utilizamos `mv` una vez más, +pero esta vez sólo usaremos el nombre de un directorio como el segundo parámetro +para indicar a `mv` que queremos mantener el nombre de archivo, +pero poner el archivo en algún lugar nuevo. +(es por eso que el comando se llama "mover".) +En este caso, +el nombre de directorio que usamos es el nombre de directorio especial `.` que mencionamos anteriormente. + +```bash +$ mv thesis/quotes.txt . +``` + +El resultado es mover el archivo desde el directorio en el que estaba en el directorio de trabajo actual. +`ls` ahora nos muestra que `thesis` está vacío: + +```bash +$ ls thesis +``` + +Además, +`ls` con un nombre de archivo o un nombre de directorio como parámetro sólo lista ese archivo o directorio. +Podemos usar esto para ver que `quotes.txt` todavía está en nuestro directorio actual: + +```bash +$ ls quotes.txt +``` + +```output +quotes.txt +``` + +El comando `cp` funciona muy bien como` mv`, +excepto que copia un archivo en lugar de moverlo. +Podemos comprobar que hizo lo correcto usando `ls` +con dos rutas como parámetros --- como la mayoría de los comandos Unix, +`ls` puede recibir múltiples rutas a la vez: + +```bash +$ cp quotes.txt thesis/quotations.txt +$ ls quotes.txt thesis/quotations.txt +``` + +```output +quotes.txt thesis/quotations.txt +``` + +Para probar que hicimos una copia, eliminemos el archivo `quotes.txt` del directorio actual +y después ejecutemos el mismo `ls` de nuevo. + +```bash +$ rm quotes.txt +$ ls quotes.txt thesis/quotations.txt +``` + +```error +ls: cannot access quotes.txt: No such file or directory +thesis/quotations.txt +``` + +Esta vez el error nos dice que no se puede encontrar `quotes.txt` en el directorio actual, +pero encuentra la copia en `thesis` que no hemos borrado. + +::::::::::::::::::::::::::::::::::::::::: callout + +## ¿Qué hay en un nombre? + +Tal vez notaste que todos los nombres de los archivos de Nelle son "algo punto +algo", y en esta parte de la lección, usamos siempre la extensión +`.txt`. Esto es sólo una convención: podemos llamar a un archivo `mythesis` o +casi cualquier cosa que queramos. Sin embargo, la mayoría de la gente usa nombres de dos partes +para que sea más fácil (para ellos y sus programas) diferenciar entre tipos +de archivos. La segunda parte de este nombre se llama la +**extensión de nombre de archivo** e indica +qué tipo de datos contiene el archivo: `.txt` señala un archivo de texto sin formato, `.pdf` +indica un documento PDF, `.cfg` es un archivo de configuración lleno de parámetros +para algún programa, `.png` es una imagen PNG, y así sucesivamente. + +Esto es sólo una convención, aunque una importante. Los archivos contienen solo +bytes: depende de nosotros y de nuestros programas interpretar esos bytes +de acuerdo a las reglas para archivos de texto, documentos PDF, +archivos de configuración, imágenes, etc. + +Nombrar una imagen PNG de una ballena como `whale.mp3` no lo convierte +mágicamente en una grabación del canto de las ballenas, aunque *podría* +hacer que el sistema operativo intente abrirlo con un reproductor de música +cuando alguien hace doble clic en él. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Cambiando el nombre de archivos + +Supón que has creado un archivo `.txt` en tu directorio actual para incluír una lista de las +pruebas estadísticas que necesitas hacer para analizar tus datos, y lo llamarás: `statstics.txt` + +Después de crear y guardar este archivo, te das cuenta de que has escrito mal el nombre del archivo. Si deseas +corregir el error, ¿cuál de los siguientes comandos podrías utilizar para hacerlo? + +1. `cp statstics.txt statistics.txt` +2. `mv statstics.txt statistics.txt` +3. `mv statstics.txt .` +4. `cp statstics.txt .` + +::::::::::::::: solution + +## Solución + +1. No. Mientras esto crearía un archivo con el nombre correcto, el archivo con nombre incorrecto todavía existiría en el directorio y necesitaría ser borrado. +2. Sí, esto funcionaría para renombrar el archivo. +3. No, el punto (.) indica dónde mover el archivo, pero no proporciona un nuevo nombre de archivo; no pueden crearse nombres de archivo idénticos. +4. No, el punto (.) indica dónde copiar el archivo, pero no proporciona un nuevo nombre de archivo; no pueden crearse nombres de archivo idénticos. + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Moviendo y copiando + +¿Cuál es la salida del último comando `ls` en la secuencia que se muestra a continuación? + +```bash +$ pwd +``` + +```output +/Users/jamie/data +``` + +```bash +$ ls +``` + +```output +proteins.dat +``` + +```bash +$ mkdir recombine +$ mv proteins.dat recombine +$ cp recombine/proteins.dat ../proteins-saved.dat +$ ls +``` + +1. `proteins-saved.dat recombine` +2. `recombine` +3. `proteins.dat recombine` +4. `proteins-saved.dat` + +::::::::::::::: solution + +## Solución + +Comenzamos en el directorio `/Users/jamie/data` y creamos una nueva carpeta llamada `recombine`. +La segunda línea mueve (`mv`) el archivo `proteins.dat` a la nueva carpeta (`recombine`). +La tercera línea hace una copia del archivo que acabamos de mover. La parte difícil aquí es en dónde se copió el archivo. Recuerda que `..` significa "subir un nivel", por lo que el archivo copiado ahora está en `/Users/jamie`. +Observa que `..` se interpreta con respecto al directorio actual de trabajo, +**no** con respecto a la ubicación del archivo que se está copiando. +Por lo tanto, lo único que se mostrará usando ls (en `/Users/jamie/data`) es la carpeta recombine. + +1. No, consulta la explicación anterior. `proteins-saved.dat` se encuentra en `/Users/jamie` +2. Sí +3. No, consulta la explicación anterior. `proteins.dat` se encuentra en`/Users/jamie/data/recombine` +4. No, consulta la explicación anterior. `Proteins-saved.dat` se encuentra en`/Users/jamie` + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Organización de directorios y archivos + +Jamie está trabajando en un proyecto y nota que sus archivos no están muy bien +organizados: + +```bash +$ ls -F +``` + +```output +analyzed/ fructose.dat raw/ sucrose.dat +``` + +Los archivos `fructose.dat` y` sucrose.dat` contienen la salida de sus +análisis. ¿Qué comando(s) cubierto(s) en esta lección necesita ejecutar para que los comandos a continuación +produzcan la salida mostrada? + +```bash +$ ls -F +``` + +```output +analyzed/ raw/ +``` + +```bash +$ ls analyzed +``` + +```output +fructose.dat sucrose.dat +``` + +::::::::::::::: solution + +## Solución + +```bash +mv *.dat analyzed +``` + +Jamie necesita mover sus archivos `fructose.dat` y `sucrose.dat` al directorio `analyzed`. La terminal expandirá \*.dat para abarcar todos los archivos .dat en el directorio. Después, el comando `mv` moverá la lista de archivos .dat al directorio "analyzed". + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Copiar con varios archivos + +Para este ejercicio puedes probar los comandos del directorio `data-shell/data` +En el ejemplo que sigue, ¿qué hace `cp` cuando se le dan varios nombres de archivo y un nombre de directorio?: + +```bash +$ mkdir backup +$ cp amino-acids.txt animals.txt backup/ +``` + +En el siguiente ejemplo, ¿qué hace `cp` cuando se le dan tres o más nombres de archivo? + +```bash +$ ls -F +``` + +```output +amino-acids.txt animals.txt backup/ elements/ morse.txt pdb/ planets.txt salmon.txt sunspot.txt +``` + +```bash +$ cp amino-acids.txt animals.txt morse.txt +``` + +::::::::::::::: solution + +## Solución + +Si se pasa como argumento más de un archivo seguido del nombre de un directorio (siempre que el nombre del directorio sea el último argumento), `cp` copia los archivos en el directorio especificado. + +Si se proveen tres nombres de archivo, `cp` arroja un error porque espera un nombre de directorio como último argumento. + +```output +cp: target ‘morse.txt' is not a directory +``` + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Listado recursivo y por tiempo + +El comando `ls -R` enumera el contenido de los directorios recursivamente, +es decir, enumera sus subdirectorios, subdirectorios secundarios, etc. +en orden alfabético en cada nivel. +El comando `ls -t` enumera los contenidos de acuerdo a la fecha y hora del último cambio, +empezando por los archivos o directorios modificados más recientemente. +¿En qué orden muestra los archivos el comando `ls -R -t`? + +::::::::::::::: solution + +## Solución + +El comando `ls -R` enumera los directorios recursivamente en orden cronológico de cada nivel, y los archivos en cada directorio también son desplegados en orden cronológico. + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Creación de archivos de una manera diferente + +Hemos visto cómo crear archivos de texto usando el editor `nano`. +Ahora, intenta el siguiente comando en tu directorio personal: + +```bash +$ cd # ir al directorio **home** +$ touch my_file.txt +``` + +1. ¿Qué hizo el comando touch? + Cuando abre su directorio de inicio con el explorador de archivos GUI, + ¿aparece el archivo? + +2. Utilice `ls -l` para inspeccionar los archivos. ¿Qué tan grande es `my_file.txt`? + +3. ¿En que circunstancias desearía crear un archivo de esta manera? + +::::::::::::::: solution + +## Solución + +1. El comando touch genera un nuevo archivo llamado "my\_file.txt" en tu directorio **home**. Si te encuentras en tu directorio **home**, puedes observar el archivo recién creado utilizando `ls` en la terminal. También puedes visualizar "my\_file.txt" en tu explorados de archivos GUI. +2. Cuando inspeccionas el archivo con "ls -l", nota que el tamaño de "my\_file.txt" es 0 kb. En otras palabras, no contiene dato alguno. Si abres "my\_file.txt" en un editor de texto, aparecerá en blanco. +3. Algunos programas no generan nuevos archivos de salida, pero requieren archivos en blanco que ya se hayan generado. Cuando uno de estos programas es ejecutado, automáticamente busca un archivo existente para llenarlo con su salida. El comando touch te permite generar eficientemente archivos en blanco para que este tipo de programas puedan usarlos. + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Pasar a la carpeta actual + +Después de ejecutar los siguientes comandos, +Jamie se da cuenta de que puso los archivos `sucrose.dat` y` maltose.dat` en la carpeta incorrecta: + +```bash +$ ls -F +raw/ analyzed/ +$ ls -F analyzed +fructose.dat glucose.dat maltose.dat sucrose.dat +$ cd raw/ +``` + +Rellena los espacios en blanco para mover estos archivos a la carpeta de trabajo +(es decir, en la que ella está actualmente): + +```bash +$ mv ___/sucrose.dat ___/maltose.dat ___ +``` + +::::::::::::::: solution + +## Solución + +```bash +$ mv ../analyzed/sucrose.dat ../analyzed/maltose.dat . +``` + +Recuerda que `..` se refiere al directorio padre (es decir, el directorio en el nivel superior al actual) y `.` se refiere al directorio actual. + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Utilizando `rm` con seguridad + +¿Qué ocurre cuando escribimos `rm -i thesis/quotations.txt`? +¿Por qué querríamos esta protección cuando usamos `rm`? + +::::::::::::::: solution + +## Solución + +```bash +$ rm: remove regular file 'thesis/quotations.txt'? +``` + +La opción -i provocará que se pregunte antes de eliminar un elemento. La terminal de Unix no cuenta con una papelera de reciclaje, así que todos los archivos que sean eliminados desaparecerán para siempre. Por medio de la opción -i tienes la oportunidad de revisar que sólo estés eliminando los archivos que realmente deseas borrar. + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Copiar una estructura de carpetas sin archivos + +Estás iniciando un nuevo experimento y te gustaría duplicar la estructura de archivos +que utilizaste para tu experimento anterior, sin los archivos de datos para que puedas +añadir los nuevos datos. + +Suponte que la estructura de archivos está en una carpeta llamada '2016-05-18-data', +que contiene un directorio `data`. `data` a su vez contiene dos carpetas denominadas `raw` y `processed`, que contienen archivos de datos. +El objetivo es copiar la estructura de archivos de la carpeta `2016-05-18-data` +en una carpeta llamada `2016-05-20-data` y eliminar los archivos de datos de +el directorio que acabas de crear. + +¿Cuál de los siguientes conjuntos de comandos lograrían este objetivo? +¿Qué harían los otros comandos? + +```bash +$ cp -r 2016-05-18-data/ 2016-05-20-data/ +$ rm 2016-05-20-data/data/raw/* +$ rm 2016-05-20-data/data/processed/* +``` + +```bash +$ rm 2016-05-20-data/raw/* +$ rm 2016-05-20-data/processed/* +$ cp -r 2016-05-18-data/ 2016-5-20-data/ +``` + +```bash +$ cp -r 2016-05-18-data/ 2016-05-20-data/ +$ rm -r -i 2016-05-20-data/ +``` + +::::::::::::::: solution + +## Solución + +El primer grupo de comandos logra este objetivo. Primero se crea una copia recursiva de la carpeta `data`. Después, dos comandos `rm` eliminan todos los archivos en los directorios especificados. La terminal interpreta el caracter especial `*` para incluír todos los archivos y subdirectorios. + +El segundo grupo de comandos está en el orden incorrecto: intenta borrar archivos que aún no han sido copiados, seguido del comando recursivo que los copiaría. + +El tercer grupo de comandos podría lograr el objetivo deseado, pero de una forma muy poco eficiente: el primer comando copia el directorio de forma recursiva, pero el segundo comando borra de forma interactiva, requiriendo confirmación antes de borrar cada archivo y directorio. + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + + + +:::::::::::::::::::::::::::::::::::::::: keypoints + +- `cp old new` copia un archivo. +- `mkdir path` crea un nuevo directorio. +- `mv old new` mueve (renombra) un archivo o directorio. +- `rm path` elimina un archivo. +- El uso de la tecla Control puede ser descrito de muchas maneras, incluyendo` Ctrl-X`, `Control-X` y` ^ X`. +- El shell no tiene una papelera de reciclaje o bote de basura: una vez que algo se elimina, se borra completamente. +- Dependiendo del tipo de trabajo que se requiera, puede ser necesario utilizar un editor de textos más poderoso que Nano. + +:::::::::::::::::::::::::::::::::::::::::::::::::: + + diff --git a/04-pipefilter.md b/04-pipefilter.md new file mode 100644 index 00000000..d28e74ee --- /dev/null +++ b/04-pipefilter.md @@ -0,0 +1,927 @@ +--- +title: Pipes y filtros +teaching: 15 +exercises: 0 +--- + +::::::::::::::::::::::::::::::::::::::: objectives + +- Redireccionar la salida de un comando a un archivo. +- Procesar un archivo en lugar de la entrada de teclado mediante la redirección. +- Construir **pipelines** de comandos con dos o más etapas. +- Explicar lo que normalmente sucede si un programa o un **pipeline** no recibe ninguna entrada para procesar. +- Explicar las filosofía de Unix de 'pequeñas piezas, libremente unidas'. + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::: questions + +- ¿Cómo puedo combinar comandos existentes para hacer cosas nuevas? + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +Ahora que ya sabemos algunos comandos básicos, +podemos ver finalmente la característica más poderosa de la terminal: +la facilidad con la que nos permite combinar los programas existentes de nuevas maneras. +Comenzaremos con un directorio llamado `molecules` +que contiene seis archivos que describen algunas moléculas orgánicas simples. +La extensión `.pdb` indica que estos archivos están en formato Protein Data Bank, +un formato de texto simple que especifica el tipo y la posición de cada átomo en la molécula. + +```bash +$ ls molecules +``` + +```output +cubane.pdb ethane.pdb methane.pdb +octane.pdb pentane.pdb propane.pdb +``` + +Entra a ese directorio usando el comando `cd` y ejecuta el comando `wc *.pdb`. +`wc` es el comando "word count": +cuenta el número de líneas, palabras y caracteres de un archivo. +El `*` en `*.pdb` coincide con cero o más caracteres, +por lo que la terminal convierte `*.pdb` en una lista de todos los archivos `.pdb` en el directorio actual: + +```bash +$ cd molecules +$ wc *.pdb +``` + +```output + 20 156 1158 cubane.pdb + 12 84 622 ethane.pdb + 9 57 422 methane.pdb + 30 246 1828 octane.pdb + 21 165 1226 pentane.pdb + 15 111 825 propane.pdb + 107 819 6081 total +``` + +::::::::::::::::::::::::::::::::::::::::: callout + +## Caracteres especiales + +`*` Es un caracter especial o **wild card**. Corresponde a cero o más +caracteres, así que `*.pdb` coincide con` ethane.pdb`, `propane.pdb`, y cada +archivo que termina con '.pdb'. Por otro lado, `p*.pdb` sólo coincide con +`pentane.pdb` y` propane.pdb`, porque la 'p' al inicio +hace coincidir los nombres de archivos que comienzan con la letra 'p'. + +`?` también es un caracter especial, pero sólo coincide con un solo carácter. Esto +significa que `p?.pdb` podría coincidir con `pi.pdb` o` p5.pdb` (si existieran +en el directorio `molecules`), pero no` propane.pdb`. +Podemos usar cualquier número de caracteres especiales a la vez: por ejemplo, `p*.p?*` +coincide con cualquier cosa que comience con una 'p' y termine con '.', 'p', y al +menos un carácter más (ya que `?` tiene que coincidir con un carácter, y +el final `*` puede coincidir con cualquier número de caracteres). Por lo tanto, `p*.p?*` +coincidirá con `preferred.practice`, e incluso `p.pi` (dado que el primer `*` +no coincide con ningún carácter), pero no `quality.practice` (ya que no inicia +con 'p') o `preferred.p` (porque no hay al menos un carácter después de +'.p'). + +Cuando la terminal reconoce un caracter especial lo expande para crear una +lista de nombres de archivo coincidentes *antes* de ejecutar el comando +seleccionado. Como excepción, si una expresión con caracteres especiales no coincide +con algún archivo, la terminal pasará la expresión como un parámetro al comando +tal y como está escrita. Por ejemplo, ejecutar `ls *.pdf` en el directorio` molecules` +(que contiene sólo los archivos con nombres que terminan con `.pdb`) da como resultado +un mensaje de error indicando que no hay ningún archivo llamado `* .pdf`. +Sin embargo, generalmente comandos como `wc` y` ls` ven las listas de +nombres de archivo que coinciden con estas expresiones, pero no los comodines +por si solos. Es la terminal, no los otros programas, la que se ocupa de +expandir los caracteres especiales, este es otro ejemplo de diseño ortogonal. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Usando caracteres especiales + +En el directorio `molecules`, ¿qué variación del comando` ls` +producirá esta salida? + +`ethane.pdb methane.pdb` + +1. `ls *t*ane.pdb` +2. `ls *t?ne.*` +3. `ls *t??ne.pdb` +4. `ls ethane.*` + +::::::::::::::: solution + +## Solución + +La solución es 3. + +1. muestra todos los archivos que contienen cualquier número o combinación de caracteres seguidos de la letra `t`, otro caracter único, y terminan con `ane.pdb`. Esto incluye `octane.pdb` y `pentane.pdb`. + +2. muestra todos los archivos que contienen cualquier número o combinación de caracteres, `t`, otro caracter, `ne.`, seguido de otro número o combinación de caracteres. Esto regresaría `octane.pdb` y `pentane.pdb` pero nad que termine con `thane.pdb`. + +3. soluciona el problema de la opción 3 agregando dos caracteres entre `t` y `me`. Esta es la opción correcta. + +4. sólo muestra archivos que comienzan con `ethane.`. + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +Si ejecutamos `wc -l` en lugar de` wc`, +la salida sólo muestra el número de líneas por archivo: + +```bash +$ wc -l *.pdb +``` + +```output + 20 cubane.pdb + 12 ethane.pdb + 9 methane.pdb + 30 octane.pdb + 21 pentane.pdb + 15 propane.pdb + 107 total +``` + +También podemos usar `-w` para obtener sólo el número de palabras, +o `-c` para obtener sólo el número de caracteres. + +¿Cuál de estos archivos es el más corto? Es una pregunta fácil de responder cuando sólo hay seis archivos, pero ¿y si hubiera 6,000? +Nuestro primer paso hacia una solución es ejecutar el comando: + +```bash +$ wc -l *.pdb > lengths.txt +``` + +El símbolo "mayor que", `>`, le dice a la terminal que **redireccione** la salida del comando +a un archivo en lugar de imprimirlo en la pantalla. (Es por eso que no hay salida de pantalla: +en vez de mostrarlo, todo lo que `wc` imprime se ha enviado al +archivo `lengths.txt`.) Si no existe el archivo, la terminal lo creará. Si el archivo existe, será +sobrescrito silenciosamente, lo que puede provocar pérdida de datos y, +por lo tanto, requiere cierta precaución. +`ls lengths.txt` confirma que el archivo existe: + +```bash +$ ls lengths.txt +``` + +```output +lengths.txt +``` + +Ahora podemos enviar el contenido de `lengths.txt` a la pantalla usando `cat lengths.txt`. +`cat` significa "concatenate" (concatenar): +imprime el contenido de los archivos uno tras otro. +En este caso sólo hay un archivo, +así que `cat` sólo nos muestra lo que éste contiene: + +```bash +$ cat lengths.txt +``` + +```output + 20 cubane.pdb + 12 ethane.pdb + 9 methane.pdb + 30 octane.pdb + 21 pentane.pdb + 15 propane.pdb + 107 total +``` + +::::::::::::::::::::::::::::::::::::::::: callout + +## Salida Página por página + +Continuaremos usando `cat` en esta lección, por conveniencia y consistencia, +pero tiene la desventaja de que siempre vuelca todo el archivo en la pantalla. +En la práctica es más útil el comando `less`, +que se utiliza como `$ less lengths.txt`. +Este comando muestra sólo el contenido del archivo que cabe en una pantalla y luego se detiene. +Puedes avanzar a la siguiente pantalla presionando la barra espaciadora, +o retroceder presionando `b`. Para salir, pulsa `q`. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +Ahora utilizemos el comando `sort` para ordenar el contenido. +También usaremos el indicador `-n` para especificar que el tipo de orden +que requerimos es numérico en lugar de alfabético. +Esto *no* cambia el archivo; +sólo despliega el resultado ordenado en la pantalla: + +```bash +$ sort -n lengths.txt +``` + +```output + 9 methane.pdb + 12 ethane.pdb + 15 propane.pdb + 20 cubane.pdb + 21 pentane.pdb + 30 octane.pdb +107 total +``` + +Podemos poner la lista de líneas ordenada en otro archivo temporal llamado `sorted-lengths.txt` +poniendo `> sorted-lengths.txt` después del comando, +así como usamos `> lengths.txt` para poner la salida de `wc` en `lengths.txt`. +Una vez que hayamos hecho eso, +podemos ejecutar otro comando llamado `head` para obtener las primeras líneas de `sorted-lengths.txt`: + +```bash +$ sort -n lengths.txt > sorted-lengths.txt +$ head -n 1 sorted-lengths.txt +``` + +```output + 9 methane.pdb +``` + +El parámetro `-n 1` con `head` indica que +sólo queremos la primera línea del archivo; +`-n 20` conseguirá las primeras 20, y así sucesivamente. +Dado que `sorted-lengths.txt` contiene las longitudes de nuestros archivos ordenados de menor a mayor, la salida de `head` debe ser el archivo con menos líneas. + +::::::::::::::::::::::::::::::::::::::::: callout + +## Redirigiendo al mismo archivo + +Es una mala idea intentar redireccionar +la salida de un comando que opera en un archivo, +al mismo archivo. Por ejemplo: + +```bash +$ sort -n lengths.txt > lengths.txt +``` + +Hacer algo como esto puede regresar +resultados incorrectos y/o eliminar +el contenido de `lengths.txt`. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +Si crees que es confuso, +no estás solo: +incluso una vez que entiendas lo que `wc`,` sort` y `head` hacen, +todos esos archivos intermedios hacen difícil seguir el hilo de lo que está pasando. +Podemos hacerlo más fácil de entender ejecutando `sort` y `head` juntos: + +```bash +$ sort -n lengths.txt | head -n 1 +``` + +```output + 9 methane.pdb +``` + +La barra vertical, `|`, entre los dos comandos se denomina **pipe** (pronunciado paip). +El **pipe** le dice a la terminal que queremos usar +la salida del comando a la izquierda +como entrada al comando de la derecha. +La computadora puede crear un archivo temporal si es necesario, +copiar datos de un programa a otro en la memoria, +o cualquier otra cosa que sea necesaria; +no es necesario que lo entendamos para hacerlo funcionar. + +Nada nos impide encadenar **pipes** consecutivamente. Por ejemplo, puedes enviar la salida de `wc` directamente a `sort`, +y luego la salida resultante a `head`. +Así, primero usamos un **pipe** para enviar la salida de `wc` a `sort`: + +```bash +$ wc -l *.pdb | sort -n +``` + +```output + 9 methane.pdb + 12 ethane.pdb + 15 propane.pdb + 20 cubane.pdb + 21 pentane.pdb + 30 octane.pdb + 107 total +``` + +Y ahora enviamos la salida de este **pipe**, a través de otro **pipe**, a `head`, para que el **pipeline** completo se convierta en: + +```bash +$ wc -l *.pdb | sort -n | head -n 1 +``` + +```output + 9 methane.pdb +``` + +Esto es exactamente como un matemático anidando funciones como *log(3x)* +Y diciendo "el logaritmo de tres veces *x*". +En nuestro caso, +el cálculo es "cabeza de la lista ordenada del número de líneas de `*.pdb`". + +Esto es lo que realmente sucede detrás de la terminal cuando creamos un **pipe**. +Cuando una computadora ejecuta un programa (cualquier programa) crea un **proceso** +en memoria para almacenar el software del programa y su estado actual. +Cada proceso tiene un canal de entrada llamado **entrada estándar**. +(Para este punto, puede sorprenderte que el nombre es tan memorable, pero no te preocupes, +la mayoría de los programadores de Unix lo llaman "stdin"). +Cada proceso también tiene un canal de salida predeterminado llamado **salida estándar** +(o "stdout"). Un tercer canal de salida llamado **error estándar** (stderr) también +existe. Este canal suele utilizarse para mensajes de error o de diagnóstico y +permite al usuario canalizar la salida de un programa a otro mientras sigue recibiendo +mensajes de error en el terminal. + +La terminal es realmente otro programa. Bajo circunstancias normales, +lo que ingresemos en el teclado se envía a la entrada estándar de la terminal, +y lo que produce en la salida estándar se muestra en nuestra pantalla. +Cuando le decimos a la terminal que ejecute un programa, +ésta crea un nuevo proceso +y envía temporalmente lo que tecleamos en nuestro teclado a la entrada estándar de ese proceso, +y lo que el proceso envía a la salida estándar, la terminal lo envía a la pantalla. + +Esto es lo que ocurre cuando ejecutamos `wc -l *.pdb > lengths.txt`. +La terminal comienza diciéndole a la computadora que cree un nuevo proceso para ejecutar el programa `wc`. Como hemos proporcionado algunos nombres de archivo como parámetros, +`wc` lee estos en vez de la entrada estándar. +Y puesto que hemos utilizado `>` para redirigir la salida a un archivo, +la terminal conecta la salida estándar del proceso a ese archivo. + +Si ejecutamos `wc -l *.pdb | sort -n` en su lugar, +la terminal crea dos procesos +(uno para cada proceso en el **pipe**) +de modo que `wc` y` sort` funcionan simultáneamente. +La salida estándar de `wc` es alimentada directamente a la entrada estándar de `sort`; +ya que no hay redirección con `>`, +la salida de `sort` va a la pantalla. +Y si ejecutamos `wc -l * .pdb | sort -n | head -n 1`, +obtenemos tres procesos con datos que fluyen de los archivos, +a través de `wc` a `sort`, de `sort` a` head` y finalmente a la pantalla. + +![](fig/redirects-and-pipes.png){alt='Redirects and Pipes'} + +Esta sencilla idea es la razón por la cual Unix ha tenido tanto éxito. +En lugar de crear enormes programas que tratan de hacer muchas cosas diferentes, +los programadores de Unix se centran en crear muchas herramientas simples que hacen bien su trabajo y son capaces de cooperar entre sí. Este modelo de programación se llama "**pipes** y **filtros**". +Ya hemos visto **pipes**; +un **filtro** es un programa como `wc` o` sort` +que transforma una entrada en una salida. +Casi todas las herramientas estándar de Unix pueden funcionar de esta manera: +a menos que se les indique lo contrario, +leen de entrada estándar, hacen algo con lo que han leído, y escriben en la salida estándar. + +La clave es que cualquier programa que lea líneas de texto de entrada estándar +y escriba líneas de texto en la salida estándar +puede combinarse con cualquier otro programa que se comporte de esta manera también. +Puedes *y debes* escribir tus programas de esta manera +para que tú y otras personas puedan poner esos programas en **pipes** y así multiplicar su poder. + +::::::::::::::::::::::::::::::::::::::::: callout + +## Redireccionamiento de entrada + +Además de usar `>` para redirigir la salida de un programa, podemos usar `<` para +redirigir su entrada, por ejemplo, para leer un archivo en lugar de la entrada estándar. En lugar de escribir `wc ammonia.pdb`, podríamos escribir +`wc < ammonia.pdb`. En el primer caso, `wc` obtiene un parámetro de línea de comandos +diciéndole qué archivo abrir. En el segundo, `wc` no tiene +ningun parámetro de la línea de comandos, por lo que se lee desde la entrada estándar, pero +hemos indicado al shell que envíe el contenido de `ammonia.pdb` a la entrada estándar de `wc`, +por lo que el resultado de ambos comandos es el mismo. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +## Pipeline de Nelle: Comprobación de archivos + +Nelle ha procesado sus muestras en su máquina de ensayo, +generando 17 archivos en el directorio `north-pacific-gyre/2012-07-03` descrito anteriormente. +Como un chequeo rápido, a partir de su directorio de inicio, Nelle teclea: + +```bash +$ cd north-pacific-gyre/2012-07-03 +$ wc -l *.txt +``` + +La salida son 18 líneas que como estas: + +```output +300 NENE01729A.txt +300 NENE01729B.txt +300 NENE01736A.txt +300 NENE01751A.txt +300 NENE01751B.txt +300 NENE01812A.txt +... ... +``` + +Ahora escribe esto: + +```bash +$ wc -l *.txt | sort -n | head -n 5 +``` + +```output + 240 NENE02018B.txt + 300 NENE01729A.txt + 300 NENE01729B.txt + 300 NENE01736A.txt + 300 NENE01751A.txt +``` + +Ups: uno de los archivos tiene 60 líneas menos que los otros. +Cuando Nelle vuelve y lo revisa +ve que hizo ese ensayo a las 8:00 un lunes por la mañana. Alguien +probablemente usó la misma máquina ese fin de semana, +y olvidó reiniciarla. +Antes de volver a analizar esa muestra, +decide comprobar si algunos archivos tienen demasiados datos: + +```bash +$ wc -l *.txt | sort -n | tail -n 5 +``` + +```output + 300 NENE02040B.txt + 300 NENE02040Z.txt + 300 NENE02043A.txt + 300 NENE02043B.txt +5040 total +``` + +Esas cifras parecen buenas pero, ¿qué es esa 'Z' en la antepenúltima línea? +todas sus muestras deben estar marcadas con "A" o "B"; +por convención, +su laboratorio utiliza 'Z' para indicar muestras con información que falta. +Para encontrar a otros archivos como este, Nelle hace lo siguiente: + +```bash +$ ls *Z.txt +``` + +```output +NENE01971Z.txt NENE02040Z.txt +``` + +Como esperaba, +cuando comprueba el registro en su computadora portátil, no hay profundidad registrada para ninguna de esas muestras. +Ya que es demasiado tarde para obtener la información de otra manera, +ella debe excluir esos dos archivos de su análisis. +Podría simplemente borrarlos usando `rm`, +pero en realidad hay algunos análisis que podría hacer más tarde, donde la profundidad no importa, +por lo que, en vez de borrarlos, sólo tendrá cuidado al seleccionar archivos utilizando la expresión con caracteres especiales `*[AB].txt`. Como siempre, el `*` coincide con cualquier número de caracteres; +la expresión `[AB]` coincide con una 'A' o una 'B', +por lo que coincide con los nombres de todos los archivos de datos válidos que tiene. + +::::::::::::::::::::::::::::::::::::::: challenge + +## ¿Qué hace `sort -n`? + +Si ejecutamos `sort` en este archivo: + +```source +10 +2 +19 +22 +6 +``` + +la salida es: + +```output +10 +19 +2 +22 +6 +``` + +Si ejecutamos `sort -n` en la misma entrada, obtendremos esto en su lugar: + +```output +2 +6 +10 +19 +22 +``` + +Explique por qué `-n` tiene este efecto. + +::::::::::::::: solution + +## Solución + +La opción `-n` indica un ordenamiento numérico, en lugar de alfabético. + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## ¿Qué significa `<`? + +Muévete al directorio `data-shell` (el directorio en el nivel más alto del ejemplo). + +¿Cuál es la diferencia entre: + +```bash +$ wc -l notes.txt +``` + +y: + +```bash +$ wc -l < notes.txt +``` + +::::::::::::::: solution + +## Solución + +`<` se usa para redirigir la entrada a un comando. + +En los dos ejemplos, la terminal regresa el número de líneas en la entrada al comando `wc`. En el primer ejemplo, la entrada es el archivo `notes.txt` y el nombre del archivo se menciona en la salida del comando `wc`. En el segundo ejemplo, el contenido del archivo `notes.txt` es redireccionado a la entrada estándar. Es como si hubiéramos introducido el contenido del archivo a mano. Por esto, el nombre del archivo no es especificado en la salida, sólo el número de líneas. Inténtalo por tu cuenta. + +```bash +$ wc -l +this +is +a test +Ctrl-D # Esto le indica a la terminal que has terminado de teclear la entrada. +``` + +```output +3 +``` + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +> ## ¿Qué significa `>>`? +> +> Hemos visto el uso de `>` pero hay un operador similar `>>` que funciona un poco distinto. Aprenderemos sobre la diferencia de estos comandos impriendo algunas cadenas de caracteres. Podemos usar el comando `echo` para imprimir cadenas de caracteres, e.g.: + +> ```bash +> $ echo El comando echo imprime el texto +> ``` +> +> ```output +> El comando echo imprime el texto +> ``` + +> Ahora prueba los comandos siguientes para revelar la diferencia entre los dos operadores. + +¿Cuál es la diferencia entre: + +::::::::::::::::::::::::::::::::::::::: challenge + +```bash +$ echo hello > testfile01.txt +``` + +y: + +```bash +$ echo hello >> testfile02.txt +``` + +Pista: Intenta ejecutar cada comando dos veces seguidas y después examinar los archivos de salida. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Más información sobre caracteres especiales + +Sam tiene un directorio que contiene datos de calibración, otros datos y descripciones de +estos datos: + +```bash +2015-10-23-calibration.txt +2015-10-23-dataset1.txt +2015-10-23-dataset2.txt +2015-10-23-dataset_overview.txt +2015-10-26-calibration.txt +2015-10-26-dataset1.txt +2015-10-26-dataset2.txt +2015-10-26-dataset_overview.txt +2015-11-23-calibration.txt +2015-11-23-dataset1.txt +2015-11-23-dataset2.txt +2015-11-23-dataset_overview.txt +``` + +Antes de ir a otro viaje de campo, Sam quiere respaldar sus datos y +enviar algunos **datasets** a su colega Bob. Sam utiliza los siguientes comandos +para lograrlo: + +```bash +$ cp *dataset* /backup/datasets +$ cp ____calibration____ /backup/calibration +$ cp 2015-____-____ ~/send_to_bob/all_november_files/ +$ cp ____ ~/send_to_bob/all_datasets_created_on_a_23rd/ +``` + +Ayuda a Sam rellenando los espacios en blanco. + +::::::::::::::: solution + +## Solución + +```bash +$ cp *calibration.txt /backup/calibration +$ cp 2015-11-* ~/send_to_bob/all_november_files/ +$ cp *-23-dataset* ~send_to_bob/all_datasets_created_on_a_23rd/ +``` + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Uniendo comandos con pipes + +En nuestro directorio actual, queremos encontrar los 3 archivos que tienen el menor número de +líneas. ¿Cuál de los siguientes comandos funcionaría? + +1. `wc -l * > sort -n > head -n 3` +2. `wc -l * | sort -n | head -n 1-3` +3. `wc -l * | head -n 3 | sort -n` +4. `wc -l * | sort -n | head -n 3` + +::::::::::::::: solution + +## Solución + +La solución es la opción 4. El caracter de **pipe** `|` es usado para alimentar la entrada estándar de un proceso con la salida estándar del anterior. `>` es utilizado para redirigir la salida estándar a un archivo. ¡Inténtalo en el directorio `data-shell/molecules`! + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## ¿Por qué `uniq` sólo elimina duplicados adyacentes? + +El comando `uniq` elimina las líneas duplicadas adyacentes de su entrada. +Por ejemplo, el archivo `data-shell/salmon.txt` contiene: + +```source +coho +coho +steelhead +coho +steelhead +steelhead +``` + +El comando `uniq salmon.txt` del directorio `data-shell/data` produce: + +```output +coho +steelhead +coho +steelhead +``` + +¿Por qué crees que `uniq` sólo elimina *líneas adyacentes* duplicadas? +(Pista: piensa en datasets muy largos.) ¿Qué otro comando podría +combinarse con él en un **pipe** para eliminar todas las líneas duplicadas? + +::::::::::::::: solution + +## Solución + +```bash +$ sort salmon.txt | uniq +``` + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Comprensión de la lectura de pipes + +Un archivo llamado `animals.txt` (en el directorio `data-shell/data`) contiene los siguientes datos: + +```source +2012-11-05,deer +2012-11-05,rabbit +2012-11-05,raccoon +2012-11-06,rabbit +2012-11-06,deer +2012-11-06,fox +2012-11-07,rabbit +2012-11-07,bear +``` + +¿Qué texto pasa a través de cada uno de los **pipes** y qué incluye el redireccionamiento final en el siguiente **pipeline**? + +```bash +$ cat animals.txt | head -n 5 | tail -n 3 | sort -r > final.txt +``` + +Pista: construye el **pipeline** agregando un comando a la vez para comprobar tu respuesta. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Construcción de Pipes + +Para el archivo `animals.txt` del ejercicio anterior, el comando: + +```bash +$ cut -d , -f 2 animals.txt +``` + +produce la siguiente salida: + +```output +deer +rabbit +raccoon +rabbit +deer +fox +rabbit +bear +``` + +¿Qué otro(s) comando(s) podría(n) agregarse a estos en un **pipeline** para encontrar +qué animales contiene el archivo (sin nombres duplicados)? + +::::::::::::::: solution + +## Solución + +```bash +$ cut -d , -f 2 animals.txt | sort | uniq +``` + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Eliminación de archivos innecesarios + +Suponte que deseas borrar tus archivos de datos procesados y sólo +conservar los archivos sin procesar y el **script** de procesamiento para ahorrar espacio en disco. +Los archivos sin procesar terminan en `.dat` y los archivos procesados terminan en `.txt`. +¿Cuál de las siguientes opciones eliminaría todos los archivos de datos procesados, +y *nada más que* los archivos de datos procesados? + +1. `rm ?.txt` +2. `rm *.txt` +3. `rm * .txt` +4. `rm *.*` + +::::::::::::::: solution + +## Solución + +1. Esto eliminaría archivos con terminación `.txt` y nombres de un caracter. +2. Esta es la respuesta correcta. +3. La terminal expandiría el `*` para coincidir con todo el directorio actual, así que el comando intentaría eliminar todos los archivos, más un archivo adicional llamado `.txt`. +4. La terminal expandiría `*.*` para coincidir con todos los archivos, independientemente de su terminación. Este comando eliminaría todos los archivos. + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Expresiones con Caracteres Especiales + +Las expresiones con caracteres especiales pueden llegar a ser muy complejas, sin embargo a veces es posible escribirlas de forma que utilicen una sintaxis muy sencilla y sean un poco más elocuentes. +Considera el directorio `data-shell/north-pacific-gyre/2012-07-03` : la expresión `*[AB].txt` coincide con todos los archivos que terminan en `A.txt` o `B.txt`. Imagina que ignoras esto. + +1. ¿Podrías hacer coincidir el mismo set de archivos con una expresión que incluya caracteres especiales, pero no `[]`? *Pista:* Podrías necesitar más de una expresión. + +2. La expresión que encontraste y la expresión usada en la lección coinciden con el mismo grupo de archivos en el ejemplo. ¿Puedes identificar la ligera diferencia en la salida de ambos comandos? + +3. ¿Bajo qué circunstancias tu nueva expresión produciría un mensaje de error y la expresión original no? + +::::::::::::::: solution + +## Solución + +1. +```bash +... +$ ls *A.txt +$ ls *B.txt +... +``` + +2. La salida de la nueva expresión aparece separada porque son dos comandos independientes. + +3. Cuando no haya archivos que terminen en `A.txt`, o en `B.txt`. + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## ¿Qué tubería? + +El archivo `data-shell/data/animals.txt` contiene 586 líneas de datos en el siguiente formato: + +```output +2012-11-05,deer +2012-11-05,rabbit +2012-11-05,raccoon +2012-11-06,rabbit +... +``` + +Asumiendo que tu directorio actual sea `data-shell/data/`, ¿qué comando usarías para producir una tabla que muestre +el recuento total de cada tipo de animal en el archivo? + +1. `grep {deer, rabbit, raccoon, deer, fox, bear} animals.txt | wc -l` +2. `sort animals.txt | uniq -c` +3. `sort -t, -k2,2 animals.txt | uniq -c` +4. `cut -d, -f 2 animals.txt | uniq -c` +5. `cut -d, -f 2 animals.txt | sort | uniq -c` +6. `cut -d, -f 2 animals.txt | sort | uniq -c | wc -l` + +::::::::::::::: solution + +## Solución + +La opción 5 es la respuesta correcta. Si se te dificulta entender por qué, intenta probar los comandos, o las subsecciones de los **pipelines** (sólo asegúrate de estar en el directorio `data-shell/data`). + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Adición de datos + +Considera el archivo `animals.txt`, utilizado en el ejercicio anterior. +Después de estos comandos, selecciona la respuesta que +describe el contenido del archivo `animalsUpd.txt`: + +```bash +$ head -3 animals.txt > animalsUpd.txt +$ tail -2 animals.txt >> animalsUpd.txt +``` + +1. Las tres primeras líneas de `animals.txt` +2. Las dos últimas líneas de `animals.txt` +3. Las tres primeras líneas y las dos últimas líneas de `animals.txt` +4. La segunda y tercera líneas de `animals.txt` + +::::::::::::::: solution + +## Solución + +La opción 3 es la correcta. Para que la opción 1 fuera correcta tendríamos que haber ejecutado sólo el comando `head`. Para que la opción 2 fuera correcta tendríamos que haber ejecutado sólo el comando `tail`. Para que la opción 4 fuera correcta tendríamos que haber usado un **pipe** para enviar la salida de `head` a `tail -2` de esta forma: `head -3 animals.txt | tail -2 >> animalsUpd.txt` + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + + + +:::::::::::::::::::::::::::::::::::::::: keypoints + +- `cat` muestra el contenido de sus entradas. +- `head` muestra las primeras líneas de su entrada. +- `tail` muestra las últimas líneas de su entrada. +- `sort` ordena sus entradas. +- `wc` cuenta líneas, palabras y caracteres en sus entradas. +- `*` coincide con cero o más caracteres en un nombre de archivo, por lo que`*.txt` coincide con todos los archivos que terminan en `.txt`. +- `?` Coincide con un solo carácter en un nombre de archivo, así que `?.txt` coincide con `a.txt` pero no `any.txt`. +- `command > file` redirige la salida de un comando a un archivo. +- `first | second` es un **pipeline**: la salida del primer comando se utiliza como entrada para el segundo. +- La mejor manera de usar la terminal es utilizar **pipes** para combinar programas sencillos de propósito único (filtros). + +:::::::::::::::::::::::::::::::::::::::::::::::::: + + diff --git a/05-loop.md b/05-loop.md new file mode 100644 index 00000000..0ac0d6f0 --- /dev/null +++ b/05-loop.md @@ -0,0 +1,694 @@ +--- +title: Bucles +teaching: 15 +exercises: 0 +--- + +::::::::::::::::::::::::::::::::::::::: objectives + +- Escribir un bucle que aplique uno o más comandos por separado a cada archivo de un conjunto de archivos. +- Rastrear los valores tomados por una variable de bucle durante la ejecución del bucle. +- Explicar la diferencia entre el nombre de una variable y su valor. +- Explicar por qué los espacios y algunos caracteres de puntuación no deben usarse en nombres de archivo. +- Demostrar cómo ver qué comandos han sido ejecutados recientemente. +- Volver a ejecutar comandos ejecutados recientemente sin volver a escribirlos. + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::: questions + +- ¿Cómo puedo realizar las mismas acciones en varios archivos diferentes? + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +Los **bucles** (loops en inglés) son fundamentales para mejorar la productividad a través de la automatización, ya que nos permiten ejecutar +comandos de forma repetitiva. Al igual que los caracteres especiales y el autocompletado, el uso de bucles también +reduce la cantidad de tecleo (y los errores de escritura/dedo). +Suponte que tenemos varios cientos de archivos con datos genómicos denominados `basilisk.dat`,` unicorn.dat` y así sucesivamente. +En este ejemplo, +usaremos el directorio `creatures` que sólo tiene dos archivos de ejemplo, +pero los principios se pueden aplicar a muchos más archivos a la vez. +Nos gustaría modificar estos archivos, pero también guardar una versión de los archivos originales, nombrando las copias +`original-basilisk.dat` y` original-unicorn.dat`. +No podemos usar: + +```bash +$ cp *.dat original-*.dat +``` + +Porque se expandiría a: + +```bash +$ cp basilisk.dat unicorn.dat original-*.dat +``` + +Esto no respalda nuestros archivos, en su lugar obtenemos un error: + +```error +cp: target `original-*.dat' is not a directory +``` + +Este problema surge cuando `cp` recibe más de dos argumentos de entrada. Cuando esto sucede, +espera que la última entrada sea un directorio donde pueda copiar todos los archivos que se le pasaron. +Dado que no existe ningún directorio denominado `original-*.fasta` en el directorio `creatures`, se genera un +error. + +En cambio, podemos usar un **bucle** +para ejecutar una operación a la vez sobre cada cosa en una lista. +Aquí un ejemplo sencillo que muestra las tres primeras líneas de cada archivo de una sola vez: + +```bash +$ for filename in basilisk.dat unicorn.dat +> do +> head -n 3 $filename +> done +``` + +```output +COMMON NAME: basilisk +CLASSIFICATION: basiliscus vulgaris +UPDATED: 1745-05-02 +COMMON NAME: unicorn +CLASSIFICATION: equus monoceros +UPDATED: 1738-11-24 +``` + +Cuando la terminal reconoce la palabra clave `for`, +sabe que debe repetir un comando (o grupo de comandos) una vez para cada elemento de una lista. +Cada vez que el bucle se ejecuta (llamada iteración), un elemento de la lista es asignado secuencialmente a una **variable**, los comandos dentro del bucle se ejecutan antes de pasar al siguiente elemento de la lista. +Dentro del bucle, +pedimos el valor de la variable poniendo `$` delante de ella. +El `$` le dice al intérprete de la terminal que trate +la **variable** como un nombre de variable y substituya su valor, +en lugar de tratarlo como texto o como un comando externo. + +En este ejemplo, la lista tiene dos nombres de archivo: `basilisk.dat` y` unicorn.dat`. +Cada vez que el bucle se itera, asignará un nombre de archivo a la variable `filename` +y ejecutará el comando `head`. +La primera vez en el bucle, +`$filename` es` basilisk.dat`. +El intérprete ejecuta el comando `head` en `basilisk.dat`, +e imprime las +primeras tres líneas de `basilisk.dat`. +Para la segunda iteración, `$filename` se convierte en +`unicorn.dat`. Esta vez, la terminal ejecuta `head` en` unicorn.dat` +e imprime las tres primeras líneas de `unicorn.dat`. +Dado que la lista era sólo de dos elementos, la terminal sale del bucle `for`. + +Cuando se utilizan variables, también es +posible poner sus nombres en llaves para delimitar claramente el nombre de la variable: `$filename` es equivalente a` ${filename}`, pero es diferente de +`${file}name`. Puede ser que encuentres esta notación en programas escritos por otras personas. + +::::::::::::::::::::::::::::::::::::::::: callout + +## Siga las instrucciones + +El **prompt** de la terminal cambia de `$` a `>` y de nuevo a `$` +conforme escribimos nuestro bucle. El segundo **prompt**, `>`, es diferente para recordarnos +que todavía no hemos terminado de escribir un comando completo. Un punto y coma, `;`, +se puede utilizar para separar dos comandos escritos en una sola línea. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::::: callout + +## Los mismos símbolos, diferentes significados + +Aquí vemos `>` siendo utilizado como un prompt de la terminal, mientras que `>` también se +utiliza para redirigir la salida de un comando. +De forma similar, `$` se utiliza como prompt de la terminal, pero como vimos antes, +también se utiliza para pedir que la terminal obtenga el valor de una variable. + +Si la *terminal* imprime `>` o `$` entonces espera que escribas algo, +y el símbolo es un prompt. + +Si *tú* escribes `>` o `$`, es una instrucción de ti para +la terminal indicándole redirigir la salida o obtener el valor de una variable. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +Hemos llamado a la variable en este bucle `filename` +con el fin de hacer su propósito más claro para los lectores humanos. +A la terminal no le importa el nombre de la variable; +si escribimos este bucle como: + +```bash +for x in basilisk.dat unicorn.dat +do + head -n 3 $x +done +``` + +or: + +```bash +for temperature in basilisk.dat unicorn.dat +do + head -n 3 $temperature +done +``` + +Funcionaría exactamente de la misma manera. +*No lo hagas así.* +Los programas sólo son útiles si la gente puede entenderlos, +nombres crípticos (como `x`) o nombres engañosos (como` temperature`) +aumentan las probabilidades de que el programa no haga lo que sus lectores piensan que hace. + +He aquí un bucle un poco más complicado: + +```bash +for filename in *.dat +do + echo $filename + head -n 100 $filename | tail -n 20 +done +``` + +La terminal comienza expandiendo `*.dat` para crear la lista de archivos que procesará. +Después de esto, el **cuerpo del bucle** +ejecuta dos comandos para cada uno de esos archivos. +El primero, `echo`, simplemente imprime sus parámetros de línea de comandos a la salida estándar. +Por ejemplo: + +```bash +$ echo hello there +``` + +regresa: + +```output +hello there +``` + +En este caso, ya que la terminal expande `$filename` para que sea el nombre de un archivo, +`echo $filename` sólo imprime el nombre del archivo. +Ten en cuenta que no podemos escribir esto como: + +```bash +for filename in *.dat +do + $filename + head -n 100 $filename | tail -n 20 +done +``` + +porque entonces la primera vez a través del bucle, +cuando `$filename` se expande a `basilisk.dat`, la terminal intentará ejecutar `basilisk.dat` como un programa. Finalmente, la combinación `head` y `tail` selecciona las líneas 81-100 +de cualquier archivo que se esté procesando +(suponiendo que el archivo tiene al menos 100 líneas). + +::::::::::::::::::::::::::::::::::::::::: callout + +## Espacios en los nombres + +El espacio en blanco se utiliza para separar los elementos de la lista +que vamos a usar en el bucle. Si en la lista tenemos elementos +con espacios en blanco necesitamos entrecomillar esos elementos +y nuestra variable al usarlo. +Supongamos que nuestros archivos de datos se llaman: + +```source +red dragon.dat +purple unicorn.dat +``` + +Necesitamos usar + +```bash +for filename in "red dragon.dat" "purple unicorn.dat" +do + head -n 100 "$filename" | tail -n 20 +done +``` + +Es más sencillo simplemente evitar el uso de espacios en blanco (u otros caracteres especiales) en los nombres de archivo. + +Los archivos mencionados no existen, si corremos el código del último ejemplo, el comando `head` será incapaz de encontrarlos, sin embargo el mensaje de error regresará el nombre de los archivos que espera: + +```output +head: cannot open ‘red dragon.dat' for reading: No such file or directory +head: cannot open ‘purple unicorn.dat' for reading: No such file or directory +``` + +Intenta remover las comillas en `$filename` en el bucle anterior para observar el efecto de las comillas en los espacios en blanco: + +```output +head: cannot open ‘red' for reading: No such file or directory +head: cannot open ‘dragon.dat' for reading: No such file or directory +head: cannot open ‘purple' for reading: No such file or directory +head: cannot open ‘unicorn.dat' for reading: No such file or directory +``` + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +Volviendo a nuestro problema original de copia de archivos, +Podemos resolverlo usando este bucle: + +```bash +for filename in *.dat +do + cp $filename original-$filename +done +``` + +Este bucle ejecuta el comando `cp` una vez para cada nombre de archivo. +La primera vez, cuando `$filename` se convierte en `basilisk.dat`, +la terminal ejecuta: + +```bash +cp basilisk.dat original-basilisk.dat +``` + +La segunda vez, el comando es: + +```bash +cp unicorn.dat original-unicorn.dat +``` + +Como el comando `cp` no produce una salida normalmente, es difícil verificar que el bucle está funcionando de forma correcta. Al antecederle `echo` es posibe ver cada comando como *sería* ejecutado. El siguiente diagrama muestra lo que sucede cuando el código modificado es ejecutado, y demuestra cómo el uso de `echo` es una práctica útil. + +![](fig/shell_script_for_loop_flow_chart.svg){alt='Bucle For en acción'} + +## Pipeline de Nelle: Procesando Archivos + +Nelle ahora está lista para procesar sus archivos de datos. Dado que todavía está aprendiendo cómo utilizar la terminal, decide construir los comandos requeridos en etapas. +Su primer paso es asegurarse de que puede seleccionar los archivos correctos (recuerda, +aquellos cuyos nombres terminan en 'A' o 'B', en lugar de 'Z'). Posicionada en su directorio **home**, Nelle teclea: + +```bash +$ cd north-pacific-gyre/2012-07-03 +$ for datafile in NENE*[AB].txt +> do +> echo $datafile +> done +``` + +```output +NENE01729A.txt +NENE01729B.txt +NENE01736A.txt +... +NENE02043A.txt +NENE02043B.txt +``` + +Su siguiente paso es decidir cómo llamar a los archivos que creará el programa de análisis `goostats`. +Prefijar el nombre de cada archivo de entrada con "stats" parece simple, +así que modifica su bucle para hacer eso: + +```bash +$ for datafile in NENE*[AB].txt +> do +> echo $datafile stats-$datafile +> done +``` + +```output +NENE01729A.txt stats-NENE01729A.txt +NENE01729B.txt stats-NENE01729B.txt +NENE01736A.txt stats-NENE01736A.txt +... +NENE02043A.txt stats-NENE02043A.txt +NENE02043B.txt stats-NENE02043B.txt +``` + +Ella todavía no ha ejecutado `goostats`, +pero ahora está segura de que puede seleccionar los archivos correctos y generar los nombres de archivo de salida correctos. + +Escribir comandos una y otra vez es cada vez más tedioso, +y a Nelle le preocupa cometer errores, así que en lugar de volver a crear su bucle, +presiona la flecha hacia arriba. En respuesta, la terminal vuelve a mostrar el bucle completo en una línea (usando puntos y comas para separar las piezas): + +```bash +$ for datafile in NENE*[AB].txt; do echo $datafile stats-$datafile; done +``` + +Utilizando la tecla de flecha izquierda, Nelle realiza una copia de seguridad y cambia el comando `echo` a `bash goostats`: + +```bash +$ for datafile in NENE*[AB].txt; do bash goostats $datafile stats-$datafile; done +``` + +Cuando presiona Enter, la terminal ejecuta el comando modificado. +Sin embargo, nada parece suceder porque no hay salida. +Después de un momento, Nelle se da cuenta de que, ya que su **script** no imprime nada a la pantalla, +no tiene ni idea de si está funcionando, y mucho menos con qué rapidez. +Mata el comando de ejecución escribiendo `Ctrl-C`, +e utiliza la flecha hacia arriba para repetir el comando, +y lo edita para que se vea así: + +```bash +$ for datafile in NENE*[AB].txt; do echo $datafile; bash goostats $datafile stats-$datafile; done +``` + +::::::::::::::::::::::::::::::::::::::::: callout + +## Principio y Fin + +Podemos pasar al principio de una línea en la terminal escribiendo `Ctrl-A` +y al final usando `Ctrl-E`. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +Ahora, cuando ejecuta su programa, produce una línea de salida cada cinco segundos aproximadamente: + +```output +NENE01729A.txt +NENE01729B.txt +NENE01736A.txt +... +``` + +1518 veces 5 segundos, dividido entre 60, le dice que su **script** tomará alrededor de dos horas en terminar de analizar todos los archivos. +Como un chequeo final, abre otra ventana de terminal, +entra en `north-pacific-gyre/2012-07-03`, +e utiliza `cat stats-NENE01729B.txt` +para examinar uno de los archivos de salida. +Se ve bien, así que decide tomarse un café y ponerse al día con su lectura. + +::::::::::::::::::::::::::::::::::::::::: callout + +## Aquellos que conocen la historia pueden elegir repetirla + +Otra forma de repetir el trabajo anterior es usar el comando `history` para +obtener una lista de los últimos cientos de comandos que se han ejecutado, y +usar `!123` (donde" 123 "es reemplazado por el número de comando) para +repetir uno de esos comandos. Por ejemplo, si Nelle escribe esto: + +```bash +$ history | tail -n 5 +``` + +```output + 456 ls -l NENE0*.txt + 457 rm stats-NENE01729B.txt.txt + 458 bash goostats NENE01729B.txt stats-NENE01729B.txt + 459 ls -l NENE0*.txt + 460 history +``` + +Entonces puede volver a ejecutar `goostats` en` NENE01729B.txt` simplemente escribiendo +`!458`. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::::: callout + +## Otros comandos del historial + +Existen otros comandos de acceso directo para acceder al historial: + +- `Ctrl-R` permite buscar en el historial en un modo denominado "búsqueda reversa" ("reverse-i-search" en inglés), que permite buscar el comando más reciente en tu historial que coincide con el texto que introduzcas a continuación. Presionar `Ctrl-R` una o más veces adicionales permite buscar coincidencias más antiguas. +- `!!` recupera el comando anterior inmediato (puedes ser que esto te parezca más conveniente que usar la flecha hacia arriba). +- `!$` recupera la última palabra del último comando. Esto es más útil de lo que pensarías: después de `bash goostats NENE01729B.txt stats-NENE01729B.txt`, puedes teclear `less !$` para ver el archivo `NENE01729B.txt`, que es más rápido que utilizar la flecha hacia arriba y editar el comando. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Variables en bucles + +En el directorio `data-shell/molecules`, `ls` regresa la siguiente salida: + +```output +cubane.pdb ethane.pdb methane.pdb octane.pdb pentane.pdb propane.pdb +``` + +¿Cuál es la salida del siguiente código?: + +```bash +for datafile in *.pdb +do + ls *.pdb +done +``` + +Ahora, ¿cuál es la salida de este código?: + +```bash +for datafile in *.pdb +do + ls $datafile +done +``` + +¿Por qué estos dos bucles dan resultados diferentes? + +::::::::::::::: solution + +## Solución + +El primer bloque de código regresa la misma salida en cada iteración del bucle. La terminal expande el caracter especial `*.pdb` en el cuerpo del bucle (y al principio del mismo) para coincidir con todos los archivos que terminan en `.pdb`, y los enumera utilizando `ls`. El bucel expandido se vería así: + +```bash +for datafile in cubane.pdb ethane.pdb methane.pdb octane.pdb pentane.pdb propane.pdb +do +ls cubane.pdb ethane.pdb methane.pdb octane.pdb pentane.pdb propane.pdb +done +``` + +```output +cubane.pdb ethane.pdb methane.pdb octane.pdb pentane.pdb propane.pdb +cubane.pdb ethane.pdb methane.pdb octane.pdb pentane.pdb propane.pdb +cubane.pdb ethane.pdb methane.pdb octane.pdb pentane.pdb propane.pdb +cubane.pdb ethane.pdb methane.pdb octane.pdb pentane.pdb propane.pdb +cubane.pdb ethane.pdb methane.pdb octane.pdb pentane.pdb propane.pdb +cubane.pdb ethane.pdb methane.pdb octane.pdb pentane.pdb propane.pdb +``` + +El segundo bloque de código enumera a un archivo distinto en cada iteración. El valor de la variable `datafile` es evaluado usando `$datafile` y después enumerado usando `ls`. + +```output +cubane.pdb +ethane.pdb +methane.pdb +octane.pdb +pentane.pdb +propane.pdb +``` + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Guardar en un archivo dentro de un bucle - Primera parte + +En el mismo directorio, ¿cuál es el efecto de este bucle? + +```bash +for alkanes in *.pdb +do + echo $alkanes + cat $alkanes > alkanes.pdb +done +``` + +1. Imprime `cubane.pdb`, `ethane.pdb`, `methane.pdb`, `octane.pdb`, `pentane.pdb` y `propane.pdb`, y el texto de `propane.pdb` se guarda en un archivo llamado `alkanes.pdb`. +2. Imprime `cubane.pdb`, `ethane.pdb`, `methane.pdb`, y concatena el texto de los tres archivos en un archivo llamado `alkanes.pdb`. +3. Imprime `cubane.pdb`, `ethane.pdb`, `methane.pdb`, `octane.pdb` y `pentane.pdb`, y guarda el texto de `propane.pdb` en un archivo llamado `alkanes.pdb`. +4. Ninguna de las anteriores. + +::::::::::::::: solution + +## Solución + +1. El texto de cada archivo se escribe (uno a la vez) en `alkanes.pdb`. Sin embargo, el archivo se sobrescribe en cada iteración del bucle, por lo que el contenido final de `alkanes.pdb` es sólo el texto proveniente de `propane.pdb`. + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Guardar en un archivo en un bucle - Segunda parte + +En el mismo directorio, ¿cuál sería la salida del siguiente bucle? + +```bash +for datafile in *.pdb +do + cat $datafile >> all.pdb +done +``` + +1. Todo el texto de `cubane.pdb`, `ethane.pdb`, `methane.pdb`, `octane.pdb` y `pentane.pdb` sería + concatenado y guardado en un archivo llamado `all.pdb`. +2. El texto de `ethane.pdb` se guardará en un archivo llamado `all.pdb`. +3. Todo el texto de `cubane.pdb`, `ethane.pdb`, `methane.pdb`, `octane.pdb`, `pentane.pdb` y `propane.pdb` sería concatenado y guardado en un archivo llamado `all.pdb`. +4. Todo el texto de `cubane.pdb`, `ethane.pdb`, `methane.pdb`, `octane.pdb`, `pentane.pdb` y `propane.pdb` se imprimirá en pantalla y será salvado en un archivo llamado `all.pdb`. + +::::::::::::::: solution + +## Solución + +La opción correcta es 3. `>>` concatena en un archivo, en lugar de sobrescribirlo con la salida del comando. Dado que la salida del comando `cat` ha sido redirigida, nada se imprime en pantalla. + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Limitación de conjuntos de archivos + +En el mismo directorio, ¿cuál sería la salida del siguiente bucle?: + +```bash +for filename in c* +do + ls $filename +done +``` + +1. No se muestra ningún archivo. +2. Todos los archivos son enumerados. +3. Sólo se enumeran `cubane.pdb`, `octane.pdb` y `pentane.pdb`. +4. Sólamente se enumera `cubane.pdb`. + +::::::::::::::: solution + +## Solución + +La respuesta correcta es 4. `*` coincide con cero o más caracteres, así que cualquier nombre que comience con la letra c, seguida de cero o más caracteres, coincidirá con el comando + + +::::::::::::::::::::::::: + +¿Cómo diferiría el resultado si usáramos el siguiente comando en lugar del anterior? + +```bash +for filename in *c* +do + ls $filename +done +``` + +1. Se listarían los mismos archivos. +2. Esta vez se enumerarían todos los archivos. +3. Esta vez no enumeraría ningún archivo. +4. Sólo se enumeraría el archivo `octane.pdb`. + +::::::::::::::: solution + +## Solución + +La respuesta correcta es 4. `*` coincide con cero o más caracteres, por lo que la expresión `*c*` coincidirá con un nombre de archivo con cero o más caracteres antes de la letra c, y cero o más caracteres después de la letra c. + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Haciendo una ejecución "en seco" (dry-run) + +Un bucle es una forma de hacer muchas cosas a la vez, o de cometer muchos errores a +la vez si se diseña de forma incorrecta. Una manera de comprobar lo que un bucle *hará* +es usar el comando `echo`. En lugar de ejecutar los comandos, los mostrará en pantalla. + +Supongamos que queremos obtener una vista previa de los comandos que ejecutará el siguiente bucle, +sin ejecutarlos realmente: + +```bash +for file in *.pdb +do + analyze $file > analyzed-$file +done +``` + +¿Cuál es la diferencia entre los dos bucles abajo, y cuál +deberíamos usar? + +```bash +# Version 1 +for file in *.pdb +do + echo analyze $file > analyzed-$file +done +``` + +```bash +# Version 2 +for file in *.pdb +do + echo "analyze $file > analyzed-$file" +done +``` + +::::::::::::::: solution + +## Solución + +La versión que querríamos utilizar es la 2. Esta versión imprime en pantalla todo lo entrecomillado, expandiendo la variable del bucle porque incluye el signo `$` como prefijo. + +La versión 1 redirige la salida del comando `echo analyze $file` a un archivo, `analyzed-$file`. Es decir, se genera una serie de archivos: `analyzed-cubane.pdb`, `analyzed-ethane.pdb`, etc. + +Prueba ambas versiones en tu terminal para ver la salida. Asegúrate de abrir los archivos `analyzed-*.pdb` para ver su contenido. + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Bucles anidado + +Suponte que queremos configurar una estructura de directorios para organizar +algunos experimentos que miden constantes de velocidad de reacción que involucran distintos compuestos *y* distintas temperaturas. ¿Cuál sería el +resultado del siguiente código?: + +```bash +for species in cubane ethane methane +do + for temperature in 25 30 37 40 + do + mkdir $species-$temperature + done +done +``` + +::::::::::::::: solution + +## Solución + +Tenemos un bucle anidado, es decir, un bucle dentro de otro bucle: para cada `specie` del bucle exterior, el bucle interior (el bucle anidado) itera sobre la lista de temperaturas y crea un nuevo directorio para cada combinación. + +¡Intenta ejecutar el código para descubrir qué directorio se crean! + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + + + +:::::::::::::::::::::::::::::::::::::::: keypoints + +- Un bucle `for` repite comandos una vez para cada elemento de una lista. +- Cada bucle `for` necesita una variable para referirse al elemento en el que está trabajando actualmente. +- Uso de `$name` para expandir una variable (es decir, obtener su valor). También se puede usar `${name}`. +- No utilizar espacios, comillas o caracteres especiales como '\*' o '?' en nombres de directorios, ya que complica la expansión de variables. +- Proporcionar a los archivos nombres coherentes que sean fáciles de combinar con los caracteres especiales para facilitar la selección de los bucles. +- Utilizar la tecla de flecha hacia arriba para desplazarse por los comandos anteriores para editarlos y repetirlos. +- Usar` Ctrl-R` para buscar a través de los comandos previamente introducidos. +- Usar `history` para mostrar comandos recientes, y `!number` para repetir un comando por número. + +:::::::::::::::::::::::::::::::::::::::::::::::::: + + diff --git a/06-script.md b/06-script.md new file mode 100644 index 00000000..d98dc4dc --- /dev/null +++ b/06-script.md @@ -0,0 +1,564 @@ +--- +title: Scripts de la terminal +teaching: 15 +exercises: 0 +--- + +::::::::::::::::::::::::::::::::::::::: objectives + +- Escriba un **script** de la terminal que ejecute un comando o una serie de comandos para un conjunto fijo de archivos. +- Ejecutar un **script** de la terminal desde la línea de comandos. +- Escribir un **script** de la terminal que opere sobre un conjunto de archivos definidos por el usuario en línea de comandos. +- Crear **pipelines** que incluyan **script** de la terminal que tú y otros hayan escrito. + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::: questions + +- ¿Cómo puedo guardar y reutilizar comandos? + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +Finalmente estamos listos para ver lo que hace que la terminal sea un entorno de programación tan potente. +Vamos a tomar los comandos que repetimos con frecuencia y los vamos a guardar en archivos +de modo que podemos volver a ejecutar todas esas operaciones más tarde escribiendo un sólo comando. +Por razones históricas, a un conjunto de comandos guardados en un archivo se le llama un **script de la terminal**, pero no se equivoquen: estos son en realidad pequeños programas. + +Comencemos por volver a `molecules/` creando un nuevo archivo, `middle.sh`, que se convertirá en nuestro **script** de la terminal: + +```bash +$ cd molecules +$ nano middle.sh +``` + +El comando `nano middle.sh` abre el archivo `middle.sh` dentro del editor de texto "nano" (que se ejecuta dentro de la terminal). +Si el archivo no existe, se creará. Podemos usar el editor de texto para editar directamente el archivo - simplemente insertaremos la siguiente línea: + +```bash +head -n 15 octane.pdb | tail -n 5 +``` + +Esta es una variación del **pipe** que construimos anteriormente: selecciona las líneas 11-15 del archivo `octane.pdb`. Recuerda, *no* lo estamos ejecutando como un comando todavía: sólo estamos poniendo los comandos en un archivo. + +A continuación, guardamos el archivo (`Ctrl-O` en nano), y salimos del editor de texto (`Ctrl-X` en nano). Comprueba que el directorio `molecules` ahora contiene un archivo llamado `middle.sh`. + +Una vez que hayamos guardado el archivo, podemos pedirle a la terminal que ejecute los comandos que contiene. Nuestra terminal se llama `bash`, por lo que ejecutamos el siguiente comando: + +```bash +$ bash middle.sh +``` + +```output +ATOM 9 H 1 -4.502 0.681 0.785 1.00 0.00 +ATOM 10 H 1 -5.254 -0.243 -0.537 1.00 0.00 +ATOM 11 H 1 -4.357 1.252 -0.895 1.00 0.00 +ATOM 12 H 1 -3.009 -0.741 -1.467 1.00 0.00 +ATOM 13 H 1 -3.172 -1.337 0.206 1.00 0.00 +``` + +Efectivamente, la salida de nuestro **script** es exactamente lo que obtendríamos si ejecutamos ese **pipeline** directamente +en la terminal. + +::::::::::::::::::::::::::::::::::::::::: callout + +## Texto vs. Lo que sea + +Por lo general llamamos a programas como Microsoft Word o LibreOffice Writer "editores +de texto", pero tenemos que ser un poco más cuidadosos cuando se trata de +programación. De forma predeterminada, Microsoft Word utiliza archivos .docx para almacenar no +sólo texto, sino también información de formato sobre fuentes, encabezados, +etcétera. Esta información adicional no se almacena como caracteres y no es comprendida por +herramientas como `head`: los comandos esperan que los archivos de entrada contengan +únicamente letras, dígitos y puntuación en un teclado de computadora estándar. +Por lo tanto, al editar programas, debemos utilizar un editor de texto sin formatos o tener cuidado de guardar +nuestros archivos como texto sin formato. + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +¿Qué pasa si queremos seleccionar líneas de un archivo arbitrario? +Podríamos editar `middle.sh` cada vez para cambiar el nombre de archivo, +pero eso probablemente llevaría más tiempo que simplemente volver a escribir el comando. +En cambio, editemos `middle.sh` y hagamos que sea más versátil: + +```bash +$ nano middle.sh +``` + +Ahora, dentro de "nano", reemplaza el texto `octane.pdb` con la variable especial denominada `$1`: + +```bash +head -n 15 "$1" | tail -n 5 +``` + +Dentro de un **script** de la terminal,`$1` significa "el primer nombre de archivo (u otro parámetro) en la línea de comandos". +Ahora podemos ejecutar nuestro **script** de esta manera: + +```bash +$ bash middle.sh octane.pdb +``` + +```output +ATOM 9 H 1 -4.502 0.681 0.785 1.00 0.00 +ATOM 10 H 1 -5.254 -0.243 -0.537 1.00 0.00 +ATOM 11 H 1 -4.357 1.252 -0.895 1.00 0.00 +ATOM 12 H 1 -3.009 -0.741 -1.467 1.00 0.00 +ATOM 13 H 1 -3.172 -1.337 0.206 1.00 0.00 +``` + +o con un archivo diferente: + +```bash +$ bash middle.sh pentane.pdb +``` + +```output +ATOM 9 H 1 1.324 0.350 -1.332 1.00 0.00 +ATOM 10 H 1 1.271 1.378 0.122 1.00 0.00 +ATOM 11 H 1 -0.074 -0.384 1.288 1.00 0.00 +ATOM 12 H 1 -0.048 -1.362 -0.205 1.00 0.00 +ATOM 13 H 1 -1.183 0.500 -1.412 1.00 0.00 +``` + +::::::::::::::::::::::::::::::::::::::::: callout + +## Comillas dobles alrededor de parámetros + +Por la misma razón que ponemos la variable del bucle dentro de comillas dobles, +cuando el nombre de archivo contenga espacios, rodeamos `$1` con comillas dobles. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +Aún así necesitamos editar `middle.sh` cada vez que queramos ajustar el rango de líneas. +Vamos a arreglar esto usando las variables especiales `$2` y` $3` para el +número de líneas que se pasarán respectivamente a `head` y `tail`: + +```bash +$ nano middle.sh +``` + +```output +head -n "$2" "$1" | tail -n "$3" +``` + +Ahora podemos ejecutar: + +```bash +$ bash middle.sh pentane.pdb 15 5 +``` + +```output +ATOM 9 H 1 1.324 0.350 -1.332 1.00 0.00 +ATOM 10 H 1 1.271 1.378 0.122 1.00 0.00 +ATOM 11 H 1 -0.074 -0.384 1.288 1.00 0.00 +ATOM 12 H 1 -0.048 -1.362 -0.205 1.00 0.00 +ATOM 13 H 1 -1.183 0.500 -1.412 1.00 0.00 +``` + +Cambiando los parámetros de nuestra línea de comando, podemos cambiar el comportamiento del **script**: + +```bash +$ bash middle.sh pentane.pdb 20 5 +``` + +```output +ATOM 14 H 1 -1.259 1.420 0.112 1.00 0.00 +ATOM 15 H 1 -2.608 -0.407 1.130 1.00 0.00 +ATOM 16 H 1 -2.540 -1.303 -0.404 1.00 0.00 +ATOM 17 H 1 -3.393 0.254 -0.321 1.00 0.00 +TER 18 1 +``` + +Esto funciona, pero a la siguiente persona que use `middle.sh` se le puede dificultar ver lo que hace. +Podemos mejorar nuestro **script** agregando algunos **comentarios** en la parte superior: + +```bash +$ nano middle.sh +``` + +```output +# Select lines from the middle of a file. +# Usage: bash middle.sh filename end_line num_lines +head -n "$2" "$1" | tail -n "$3" +``` + +Un comentario comienza con un caracter `#` y se ejecuta hasta el final de la línea. La computadora ignora los comentarios, +pero son invaluables para ayudar a la gente (incluyéndote a ti en un futuro) a entender y usar **scripts**. La única advertencia es que cada vez que modifiques un **script**, debes comprobar que el comentario siga siendo preciso: +Una explicación que envía al lector en la dirección equivocada es peor que ninguna. + +¿Qué sucede si queremos procesar muchos archivos en un solo **pipeline**? +Por ejemplo, si queremos ordenar nuestros archivos `.pdb` por longitud, deberíamos escribir: + +```bash +$ wc -l *.pdb | sort -n +``` + +dado que `wc -l` lista el número de líneas en los archivos (recuerda que `wc` significa 'word count', y si agregas el `-l` significa 'contar líneas') y `sort -n` ordena numéricamente. +Podríamos poner esto en un archivo, pero entonces sólo podría ordenar una lista de archivos `.pdb` en el directorio actual. +Si queremos ser capaces de obtener una lista ordenada de otros tipos de archivos, necesitamos una manera de conseguir estos nombres en el **script**. No podemos usar `$1`, `$2`, y así sucesivamente porque no sabemos cuántos archivos hay. +En su lugar, utilizamos la variable especial `$@`, lo que significa, "Todos los parámetros de la línea de comandos para el **script**". También debemos poner `$@` dentro de comillas dobles para el caso de parámetros que contienen espacios (`"$@"` es equivalente a `"$1"` `"$2"` ...). He aquí un ejemplo: + +```bash +$ nano sorted.sh +``` + +```output +# Sort filenames by their length. +# Usage: bash sorted.sh one_or_more_filenames +wc -l "$@" | sort -n +``` + +```bash +$ bash sorted.sh *.pdb ../creatures/*.dat +``` + +```output +9 methane.pdb +12 ethane.pdb +15 propane.pdb +20 cubane.pdb +21 pentane.pdb +30 octane.pdb +163 ../creatures/basilisk.dat +163 ../creatures/unicorn.dat +``` + +::::::::::::::::::::::::::::::::::::::::: callout + +## ¿Por qué no está haciendo nada? + +¿Qué pasa si se supone que un **script** procesa un grupo de archivos, pero nosotros +no le damos ningún nombre de archivo? Por ejemplo, ¿qué pasa si escribimos?: + +```bash +$ bash sorted.sh +``` + +pero sin agregar `*.dat` (o cualquier otra cosa)? En este caso, `$@` se expande a +nada en absoluto, por lo que el **pipeline** dentro del **script** es efectivamente: + +```bash +$ wc -l | sort -n +``` + +Dado que no tiene ningún nombre de archivo, `wc` supone que debe +procesar entrada estándar, por lo que sólo se sienta allí y espera a que le demos +algunos datos de forma interactiva. Desde el exterior, sin embargo, todo lo que vemos es +que el programa está estático: el guión no parece hacer nada. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +Supongamos que acabamos de ejecutar una serie de comandos que hicieron algo útil - por ejemplo, crearon un gráfico que nos gustaría utilizar en un documento. Nos gustaría poder volver a hacer el gráfico más tarde si es necesario, por lo que queremos guardar los comandos en un archivo. En lugar de escribirlos de nuevo (y potencialmente equivocarse) podemos hacer esto: + +```bash +$ history | tail -n 5 > redo-figure-3.sh +``` + +El archivo `redo-figure-3.sh` ahora contiene: + +```source +297 bash goostats -r NENE01729B.txt stats-NENE01729B.txt +298 bash goodiff stats-NENE01729B.txt /data/validated/01729.txt > 01729-differences.txt +299 cut -d ',' -f 2-3 01729-differences.txt > 01729-time-series.txt +300 ygraph --format scatter --color bw --borders none 01729-time-series.txt figure-3.png +301 history | tail -n 5 > redo-figure-3.sh +``` + +Después de un poco de trabajo en un editor para eliminar los números de serie en los comandos, +y eliminar la línea final donde llamamos el comando `history`, tenemos un registro completamente preciso de cómo creamos dicha figura. + +En la práctica, la mayoría de las personas desarrollan **scripts** de la terminal ejecutando comandos en el prompt de dicha terminal varias veces para asegurarse de que están haciendo las cosas bien, y a continuación los guardan en un archivo para su reutilización. Este estilo de trabajo permite a la gente replicar lo que descubre sobre sus datos y su flujo de trabajo con una llamada a `history` y editando para limpiar la salida pueden guardarlo como un **script** de la terminal. + +## El pipeline de Nelle: Creando un **script** + +El supervisor de Nelle insistió en que todos sus análisis deben ser reproducibles. Nelle se da cuenta que debería haber proporcionado un par de parámetros adicionales a `goostats` cuando procesó sus archivos. Esto podría haber sido un desastre si hubiera hecho todo el análisis a mano, pero gracias a los bucles `for`, sólo le tomará un par de horas para volver a realizar el análisis. La forma más fácil de capturar todos los pasos es en un **script**. Ella ejecuta el editor y escribe lo siguiente: + +```bash +# Calculate reduced stats for data files. +for datafile in "$@" +do + echo $datafile + bash goostats $datafile stats-$datafile +done +``` + +Guarda esto en un archivo llamado `do-stats.sh` para que ahora pueda volver a hacer la primera etapa de su análisis escribiendo: + +```bash +$ bash do-stats.sh NENE*[AB].txt +``` + +Ella también puede hacer esto: + +```bash +$ bash do-stats.sh NENE*[AB].txt | wc -l +``` + +de modo que el **output** es sólo el número de archivos procesados en lugar de los nombres de los archivos que se procesaron. + +Una cosa a tener en cuenta sobre el **script** de Nelle es que permite que la persona que lo ejecuta decida que archivos procesar. +Podría haberlo escrito así: + +```bash +# Calculate stats for Site A and Site B data files. +for datafile in NENE*[AB].txt +do + echo $datafile + bash goostats $datafile stats-$datafile +done +``` + +La ventaja es que esto siempre selecciona los archivos correctos: Ella no tiene que recordar excluir los archivos 'Z'. +La desventaja es que *siempre* selecciona esos archivos - ella no puede ejecutarlo en todos los archivos (incluidos los archivos 'Z'), o en los archivos 'G' o 'H' que sus colegas de la Antártida están produciendo, sin editar el **script** manualmente. +Si quisiera ser más aventurera, Nelle podría modificar su **script** para verificar los parámetros en línea de comandos, y utilizar `NENE*[AB].txt` si no se ha proporcionado ninguno. Por supuesto, esto introduce otro equilibrio entre flexibilidad y complejidad. + +::::::::::::::::::::::::::::::::::::::: challenge + +## Variables en los **scripts** de la terminal + +En el directorio `molecules`, imagina que tienes un **script** de la terminal llamado `script.sh` que contiene los siguientes +comandos: + +```bash +head -n $2 $1 +tail -n $3 $1 +``` + +Mientras estés en el directorio `molecules`, escribe el siguiente comando: + +```bash +bash script.sh '*.pdb' 1 1 +``` + +¿Cuál de los siguientes resultados esperarías ver? + +1. Todas las líneas entre la primera y la última línea de cada archivo que terminan en `.pdb` + en el directorio `molecules`. +2. La primera y la última línea de cada archivo que termina en `.pdb` en el directorio `molecules`. +3. La primera y la última línea de cada archivo en el directorio `molecules`. +4. Un error debido a las comillas alrededor de `*.pdb`. + +::::::::::::::: solution + +## Solución + +La respuesta correcta es la 2. +Las variables `$1`, `$2` y `$3` representan los argumentos para el **script**, tal que los comandos ejecutados son: + +```bash +$ head -n 1 cubane.pdb ethan ee.pdb octane.pdb pentane.pdb propane.pdb +$ tail -n 1 cubane.pdb ethane.pdb octane.pdb pentane.pdb propane.pdb +``` + +La terminal no expande '\* .pdb' porque está rodeado por comillas. El primer parámetro del **script** es '\*.pdb', que se expande +dentro del **script** desde el principio al final. + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Listando especies únicas + +Leah tiene varios cientos de archivos de datos, cada uno de los cuales tiene el siguiente formato : + +```source +2013-11-05,deer,5 +2013-11-05,rabbit,22 +2013-11-05,raccoon,7 +2013-11-06,rabbit,19 +2013-11-06,deer,2 +2013-11-06,fox,1 +2013-11-07,rabbit,18 +2013-11-07,bear,1 +``` + +Un ejemplo de este tipo de archivo se puede ver en data-shell/data/animal-counts/animals.txt. + +Escribe un **script** de la terminal llamado `species.sh` que tome cualquier número de +nombres de archivos como parámetros de línea de comandos, y utilice `cut`, `sort` y +`uniq` para mostrar una lista de las especies únicas que aparecen en cada uno de +esos archivos por separado. + +::::::::::::::: solution + +## Solución + +``` +# El script para encontrar especies unicas en archivos .csv en donde "species" es la segunda data field +# Este script acepta cualquier número de nombres de archivos como argumentos de la línea de comando. + +# Bucle loop +for file in $@ +do + echo "Unique species in $file:" + # Extraer nombres de especies + cut -d , -f 2 $file | sort | uniq +done +``` + +::::::::::::::::::::::::: + +## Encuentre el archivo más largo con una extensión determinada + +Escribe un **script** de la terminal llamado `longest.sh` que tome el nombre de un +directorio y una extensión de nombre de archivo como sus parámetros, e imprima +el nombre del archivo con más líneas en ese directorio con esa extensión. Por ejemplo: + +```bash +$ bash longest.sh /tmp/data pdb +``` + +Mostraría el nombre del archivo `.pdb` en`/tmp/data` que tenga más líneas. + +::::::::::::::: solution + +## Solución + +```bash + # Script que toma 2 parámetros: + # 1. un nombre de directorio + # 2. una extensión de archivo + # y muestra el nombre del archivo de ese directorio + # con las líneas que coincide con la extensión del archivo. + +wc -l $1/*.$2 | sort -n | tail -n 2 | head -n 1 +``` + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## ¿Por qué grabar los comandos en el historial antes de ejecutarlos? + +Si ejecutas el comando: + +```bash +$ history | tail -n 5 > recent.sh +``` + +El último comando del archivo es el mismo comando `history`, es decir, +la terminal ha añadido `history` al registro de comandos antes de +ejecutarlo. De hecho, la terminal *siempre* agrega comandos al registro +antes de ejecutarlos. ¿Por qué crees que hace esto? + +::::::::::::::: solution + +## Solución + +Si un comando hace que algo se cuelgue, podría ser útil saber cuál era ese comando para saber cuál fue el problema. +Si el comando sólo se registra después de ejecutarlo, no tendríamos un registro del último comando ejecutado en caso +de un bloqueo. + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Script de lectura y comprensión + +Considera el directorio data-shell/molecules una vez más. Este contiene una cantidad de archivos .pdb +además de otro archivo que hayas creado. Explica, para los siguientes tres ejemplos, que hace el **script** llamado example.sh cuando lo ejecutas como `bash example.sh *.pdb`: + +```bash +# Script 1 +echo *.* +``` + +```bash +# Script 2 +for filename in $1 $2 $3 +do + cat $filename +done +``` + +```bash +# Script 3 +echo $@.dat +``` + +::::::::::::::: solution + +## Solución + +El **script** 1 mostrará una lista de todos los archivos que contienen un punto en su nombre. + +El **script** 2 mostrará el contenido de los primeros 3 archivos que coinciden con la extensión del archivo. +La terminal expande el caracter especial antes de pasar los argumentos al script example.sh. + +El **script** 3 mostrará todos los parámetros del script (es decir, todos los archivos .pdb), seguido de .pdb. +cubane.pdb etano.pdb metano.pdb octano.pdb pentano.pdb propano.pdb.pdb + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Depuración (debugging) de scripts + +Supongamos que se ha guardado el siguiente **script** en un archivo denominado `do-errors.sh` +en el directorio `north-pacific-gyre/2012-07-03` de Nelle: + +```bash +# Calcular las estadísticas de los archivos de datos. +for datafile in "$@" +do + echo $datfile + bash goostats $datafile stats-$datafile +done +``` + +Cuando lo ejecutas: + +```bash +$ bash do-errors.sh NENE*[AB].txt +``` + +El **output** está en blanco. +Para averiguar por qué, vuelve a ejecutar el **script** utilizando la opción `-x`: + +```bash +bash -x do-errors.sh NENE*[AB].txt +``` + +¿Cuál es el resultado que muestra? +¿Qué línea es responsable del error? + +::::::::::::::: solution + +## Solución + +El indicador `-x` hace que `bash` se ejecute en modo de depuración. Esto muestra cada comando mientras se ejecuta, +lo que te ayudará a localizar errores. En este ejemplo, podemos ver que `echo` no está mostrando nada. +Hemos creado un error tipográfico en el nombre de la variable del bucle, la variable `datfile` no existe, +por lo que devuelve una cadena vacía. + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + + + +:::::::::::::::::::::::::::::::::::::::: keypoints + +- Guardar comandos en archivos (normalmente llamados **scripts** de la terminal) para su reutilización. +- `bash filename` ejecuta los comandos guardados en un archivo. +- `$@`se refiere a todos los parámetros de la línea de comandos de un **script** de la terminal. +- `$1`, `$2`, etc., se refieren al primer parámetro de la línea de comandos, al segundo parámetro de la línea de comandos, etc. +- Coloque las variables entre comillas si los valores tienen espacios en ellas. +- Dejar que los usuarios decidan qué archivos procesar es más flexible y más consistente con los comandos de Unix. + +:::::::::::::::::::::::::::::::::::::::::::::::::: + + diff --git a/07-find.md b/07-find.md new file mode 100644 index 00000000..6f27f738 --- /dev/null +++ b/07-find.md @@ -0,0 +1,695 @@ +--- +title: Encontrando archivos +teaching: 15 +exercises: 0 +--- + +::::::::::::::::::::::::::::::::::::::: objectives + +- Usar `grep` para seleccionar las líneas de archivos de texto que coincidan con patrones simples. +- Usar `find` para encontrar archivos cuyos nombres coincidan con patrones simples. +- Usar la respuesta de un comando como parámetro de entrada para otro comando. +- Explicar lo que se entiende por archivos de 'texto' y 'binarios', y por qué muchas herramientas comunes no manejan bien estos últimos. + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::: questions + +- ¿Cómo puedo encontrar archivos? +- ¿Cómo puedo encontrar algunas cosas dentro de mis archivos? + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +De la misma manera que muchos de nosotros ahora usamos "googlear" como un +verbo que significa "encontrar", los programadores de Unix usan cotidianamente +la palabra "grep". +"grep" es una contracción de "global/regular expression/print" (global/expresión regular/imprimir), +una secuencia común de operaciones en los primeros editores de texto de Unix. +También es el nombre de un programa de línea de comandos muy útil. + +El comando `grep` encuentra e imprime líneas en archivos que coinciden con un patrón. +Para nuestros ejemplos, +usaremos un archivo que contenga tres haikus publicados en +1998 en la revista *Salon*. Para este conjunto de ejemplos, +Vamos a estar trabajando en el subdirectorio "writing": + +```bash +$ cd +$ cd writing +$ cat haiku.txt +``` + +```output +The Tao that is seen +Is not the true Tao, until +You bring fresh toner. + +With searching comes loss +and the presence of absence: +"My Thesis" not found. + +Yesterday it worked +Today it is not working +Software is like that. +``` + +::::::::::::::::::::::::::::::::::::::::: callout + +## Del dicho "Para siempre, o cinco años" + +Nota: no hemos vinculado a los haikus originales porque parecen ya no estar disponibles en el sitio de *Salon*. +Como [Jeff Rothenberg dijo](https://www.clir.org/pubs/archives/ensuring.pdf), +"La información digital dura para siempre --- o cinco años, lo que ocurra primero." + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +Busquemos líneas que contengan la palabra "not": + +```bash +$ grep not haiku.txt +``` + +```output +Is not the true Tao, until +"My Thesis" not found +Today it is not working +``` + +En este ejemplo, `not` es el patrón que estamos buscando. +Es bastante simple: +cada carácter alfanumérico coincide con sí mismo. +Después del patrón viene el nombre o los nombres de los archivos que estamos buscando. +La salida son las tres líneas del archivo que contienen las letras "not". + +Vamos a probar un patrón distinto: "The". + +```bash +$ grep The haiku.txt +``` + +```output +The Tao that is seen +"My Thesis" not found. +``` + +Esta vez, las dos líneas que incluyen las letras "The" forman parte del producto de la búsqueda. +Sin embargo, una instancia de esas letras está contenida en una palabra más grande, "Thesis". + +Para restringir los aciertos a las líneas que contienen la palabra "The" por sí sola, +podemos usar `grep` con el indicador` -w`. +Esto limitará los coincidencias a palabras. + +```bash +$ grep -w The haiku.txt +``` + +```output +The Tao that is seen +``` + +Nota que la palabra o patrón de búsqueda incluye el comienzo y el final de una línea, no solamente aquellas letras rodeadas de espacios. +A veces, queremos buscar una frase, en vez de una sola palabra. Esto puede hacerse fácilmente con `grep` usando la frase entre comillas. + +```bash +$ grep -w "is not" haiku.txt +``` + +```output +Today it is not working +``` + +Hemos visto que no requerimos comillas alrededor de palabras simples, +pero es útil utilizar comillas cuando se buscan varias palabras consecutivas. +También ayuda a facilitar la distinción entre el término o frase de búsqueda +y el archivo en el que se está buscando. +Utilizaremos comillas en los próximos ejemplos. + +Otra opción útil es `-n`, que numera las líneas que coinciden: + +```bash +$ grep -n "it" haiku.txt +``` + +```output +5:With searching comes loss +9:Yesterday it worked +10:Today it is not working +``` + +Aquí, podemos ver que las líneas 5, 9 y 10 contienen las letras "it". + +Podemos combinar opciones (es decir, **flags**) como lo hacemos con otros comandos de Unix. +Por ejemplo, vamos a encontrar las líneas que contienen la palabra "the". Podemos combinar +la opción `-w` para encontrar las líneas que contienen la palabra "the" con `-n` para numerar las líneas que coinciden: + +```bash +$ grep -n -w "the" haiku.txt +``` + +```output +2:Is not the true Tao, until +6:and the presence of absence: +``` + +Ahora queremos usar la opción `-i` para hacer que nuestra búsqueda sea insensible a mayúsculas y minúsculas: + +```bash +$ grep -n -w -i "the" haiku.txt +``` + +```output +1:The Tao that is seen +2:Is not the true Tao, until +6:and the presence of absence: +``` + +Ahora, queremos usar la opción `-v` para invertir nuestra búsqueda, es decir, queremos que +obtener las líneas que NO contienen la palabra "the". + +```bash +$ grep -n -w -v "the" haiku.txt +``` + +```output +1:The Tao that is seen +3:You bring fresh toner. +4: +5:With searching comes loss +7:"My Thesis" not found. +8: +9:Yesterday it worked +10:Today it is not working +11:Software is like that. +``` + +`grep` tiene muchas otras opciones. Para averiguar cuáles son, podemos escribir: + +```bash +$ grep --help +``` + +```output +Usage: grep [OPTION]... PATTERN [FILE]... +Search for PATTERN in each FILE or standard input. +PATTERN is, by default, a basic regular expression (BRE). +Example: grep -i 'hello world' menu.h main.c + +Regexp selection and interpretation: + -E, --extended-regexp PATTERN is an extended regular expression (ERE) + -F, --fixed-strings PATTERN is a set of newline-separated fixed strings + -G, --basic-regexp PATTERN is a basic regular expression (BRE) + -P, --perl-regexp PATTERN is a Perl regular expression + -e, --regexp=PATTERN use PATTERN for matching + -f, --file=FILE obtain PATTERN from FILE + -i, --ignore-case ignore case distinctions + -w, --word-regexp force PATTERN to match only whole words + -x, --line-regexp force PATTERN to match only whole lines + -z, --null-data a data line ends in 0 byte, not newline + +Miscellaneous: +... ... ... +``` + +::::::::::::::::::::::::::::::::::::::: challenge + +## Utilizando `grep` + +Haciendo referencia a `haiku.txt` +presentado al inicio de este tema, +qué comando resultaría en la salida siguiente: + +```output +and the presence of absence: +``` + +1. `grep "of" haiku.txt` +2. `grep -E "of" haiku.txt` +3. `grep -w "of" haiku.txt` +4. `grep -i "of" haiku.txt` + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::::: callout + +## Caracteres especiales o comodines + +La verdadera ventaja de `grep` no proviene de sus opciones; viene del +hecho de que los patrones pueden incluir comodines. (El nombre técnico para +estos son **expresiones regulares**, que +es lo que significa el "re" en "grep".) Las expresiones regulares son complejas +y poderosas. Nota: Si quieres realizar búsquedas complejas, y quieres saber más detalles mira la lección +de [expresiones regulares](https://v4.software-carpentry.org/regexp/index.html). +Como prueba, podemos +encontrar líneas que tienen una 'o' en la segunda posición, por ejemplo: + +```bash +$ grep -E '^.o' haiku.txt +``` + +```output +You bring fresh toner. +Today it is not working +Software is like that. +``` + +Utilizamos el indicador `-E` y ponemos el patrón entre comillas para evitar que el shell +intente interpretarlo. (Si el patrón contiene un `*`, por +ejemplo, el shell intentaría expandirlo antes de ejecutar grep.) +El `^` en el patrón de búsqueda indica que la coincidencia debe ser al inicio de la línea. El `.` +coincide con un solo carácter (como `?` en el shell), mientras que el `o` +coincide con una 'o' real que en este caso viene a ser el segundo caracter. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Seguimiento de una especie + +Leah tiene varios cientos de +archivos de datos guardados en un directorio, cada uno de los cuales tiene el formato siguiente: + +```source +2013-11-05,deer,5 +2013-11-05,rabbit,22 +2013-11-05,raccoon,7 +2013-11-06,rabbit,19 +2013-11-06,deer,2 +``` + +Quiere escribir un **script** de shell que tome un directorio y una especie +como parámetros de línea de comandos y que le devuelva un archivo llamado `species.txt` +que contenga una lista de fechas y el número de individuos de esa especie observados en esa fecha, +como este archivo de números de conejos: + +```source +2013-11-05,22 +2013-11-06,19 +2013-11-07,18 +``` + +Escribe estos comandos y **pipes** en el orden correcto para lograrlo: + +```bash +cut -d : -f 2 +> +| +grep -w $1 -r $2 +| +$1.txt +cut -d , -f 1,3 +``` + +Sugerencia: usa `man grep` para buscar cómo seleccionar texto recursivamente en un directorio +usando grep +y `man cut` para seleccionar más de un campo en una línea. +Encuentra un ejemplo en el siguiente archivo `data-shell/data/animal-counts/animals.txt` + +::::::::::::::: solution + +## Solución + +```source +grep -w $1 -r $2 | cut -d : -f 2 | cut -d , -f 1,3 > $1.txt +``` + +Puedes llamar al **script** de la siguiente forma: + +```bash +$ bash count-species.sh bear . +``` + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Mujercitas + +Tú y tu amigo tienen una desacuerdo, después de terminar de leer *Little Women* de +Louisa May Alcott. De las cuatro hermanas en el +libro, Jo, Meg, Beth, y Amy, tu amigo piensa que Jo era la +más mencionada. Tú, sin embargo, estás segura de que era Amy. Afortunadamente tu +tienes un archivo llamado `LittleWomen.txt` en data/, que contiene el texto completo de la novela. +Utilizando un bucle `for`, ¿cómo tabularías el número de veces que cada una +de las cuatro hermanas es mencionada? + +Sugerencia: una solución sería emplear +los comandos `grep` y `wc` y un `|`, mientras que otra solución podría utilizar +opciones de `grep`. +Normalmente hay más de una forma para solucionar una tarea de programación. Cada solución es seleccionada de acuerdo a la combinación entre cuál es la que produce el resultado correcto, con mayor elegancia, de la manera más clara y con mayor velocidad. + +::::::::::::::: solution + +## Solución + +```source +for sis in Jo Meg Beth Amy +do + echo $sis: + grep -ow $sis LittleWomen.txt | wc -l +done +``` + +Alternativa, menos eficiente: + +```source +for sis in Jo Meg Beth Amy +do + echo $sis: +grep -ocw $sis LittleWomen.txt +done +``` + +Esta solución es menos eficiente porque `grep -c` solamente reporta el número de las líneas. +El número total de coincidencias que es reportado por este método va a ser más bajo si hay más de una coincidencia por línea. + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +Mientras `grep` encuentra líneas en los archivos, +El comando `find` busca los archivos. +Una vez más, +tienes muchas opciones. +Para mostrar cómo funcionan las más simples, utilizaremos el árbol de directorios que se muestra a continuación. + +![](fig/find-file-tree.svg){alt='Árbol de archivos para el ejemplo de búsqueda'} + +El directorio `writing` de Nelle contiene un archivo llamado `haiku.txt` y tres subdirectorios: +`thesis` (que contiene un archivo tristemente vacío, `empty-draft.md`), +`data` (que contiene dos archivos `LittleWomen.txt` , `one.txt` y `two.txt`), +un directorio `tools` que contiene los programas` format` y `stats`, +y un subdirectorio llamado `old`, con un archivo `oldtool`. + +Para nuestro primer comando, +ejecutemos `find .`. + +```bash +$ find . +``` + +```output +. +./data +./data/one.txt +./data/LittleWomen.txt +./data/two.txt +./tools +./tools/format +./tools/old +./tools/old/oldtool +./tools/stats +./haiku.txt +./thesis +./thesis/empty-draft.md +``` + +Como siempre, +el `.` por sí mismo significa el directorio de trabajo actual, +que es donde queremos que empiece nuestra búsqueda. +La salida de `find` es el nombre de cada archivo **y** directorio +dentro del directorio de trabajo actual. +Esto puede parecer inútil al principio, pero `find` tiene muchas opciones +para filtrar la salida y en esta lección vamos a descubrir algunas +de ellas. + +La primera opción en nuestra lista es +`-type d` que significa "encontrar directorios". +Por supuesto que +la salida de `find` serán los nombres de los cinco directorios en nuestro pequeño árbol +(incluyendo `.`): + +```bash +$ find . -type d +``` + +```output +./ +./data +./thesis +./tools +./tools/old +``` + +Si cambiamos `-type d` por `-type f`, +recibimos una lista de todos los archivos: + +```bash +$ find . -type f +``` + +```output +./haiku.txt +./tools/stats +./tools/old/oldtool +./tools/format +./thesis/empty-draft.md +./data/one.txt +./data/LittleWomen.txt +./data/two.txt +``` + +Ahora tratemos de buscar por nombre: + +```bash +$ find . -name *.txt +``` + +```output +./haiku.txt +``` + +Esperábamos que encontrara todos los archivos de texto, +Pero sólo imprime `./haiku.txt`. +El problema es que el shell amplía los caracteres comodín como `*` *antes* de ejecutar los comandos. +Dado que `*.txt` en el directorio actual se expande a `haiku.txt`, +El comando que ejecutamos era: + +```bash +$ find . -name haiku.txt +``` + +`find` hizo lo que pedimos, pero pedimos la cosa equivocada. + +Para conseguir lo que queremos, +vamos a hacer lo que hicimos con `grep`: +escribe `* txt` entre comillas simples para evitar que el shell expanda el comodín `*`. +De esta manera, +`find` obtiene realmente el patrón `*.txt`, no el nombre de archivo expandido `haiku.txt`: + +```bash +$ find . -name '*.txt' +``` + +```output +./data/one.txt +./data/LittleWomen.txt +./data/two.txt +./haiku.txt +``` + +::::::::::::::::::::::::::::::::::::::::: callout + +## Listar vs. Buscar + +`ls` y` find` se pueden usar para hacer cosas similares dadas las opciones correctas, +pero en circunstancias normales, +`ls` enumera todo lo que puede, +mientras que `find` busca cosas con ciertas propiedades y las muestra. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +Como mencionamos anteriormente, +el poder de la línea de comandos reside en la combinación de herramientas. +Hemos visto cómo hacerlo con **pipes**, +veamos otra técnica. +Como acabamos de ver, +`find . -name '*.txt'` nos da una lista de todos los archivos de texto dentro o más abajo del directorio actual. +¿Cómo podemos combinar eso con `wc -l` para contar las líneas en todos esos archivos? + +La forma más sencilla es poner el comando `find` dentro de `$()`: + +```bash +$ wc -l $(find . -name '*.txt') +``` + +```output +11 ./haiku.txt +300 ./data/two.txt +21022 ./data/LittleWomen.txt +70 ./data/one.txt +21403 total +``` + +Cuando el shell ejecuta este comando, +lo primero que hace es ejecutar lo que esté dentro del `$()`. +Luego reemplaza la expresión `$()` con la salida de ese comando. +Dado que la salida de `find` son los cuatro nombres de directorio `./data/one.txt`, `./data/LittleWomen.txt`, `./data/two.txt`, y `./haiku.txt`, +el shell construye el comando: + +```bash +$ wc -l ./data/one.txt ./data/LittleWomen.txt ./data/two.txt ./haiku.txt +``` + +que es lo que queríamos. +Esta expansión es exactamente lo que hace el shell cuando se expanden comodines como `*` y `?`, +pero nos permite usar cualquier comando que deseemos como nuestro propio "comodín". + +Es muy común usar `find` y `grep` juntos. +El primero encuentra archivos que coinciden con un patrón; +el segundo busca líneas dentro de los archivos que coinciden con otro patrón. +Aquí, por ejemplo, podemos encontrar archivos PDB que contienen átomos de hierro +buscando la cadena "FE" en todos los archivos `.pdb` por encima del directorio actual: + +```bash +$ grep "FE" $(find .. -name '*.pdb') +``` + +```output +../data/pdb/heme.pdb:ATOM 25 FE 1 -0.924 0.535 -0.518 +``` + +::::::::::::::::::::::::::::::::::::::: challenge + +## Buscando coincidencias y restando + +`-v` es una opción de `grep` que invierte la coincidencia de patrones, de modo que sólo las líneas +que *no* coinciden con el patrón se imprimen. Dado esto ¿cuál de +los siguientes comandos encontrarán todos los archivos en `/data` cuyos nombres +terminan en `s.txt` (por ejemplo, `animals.txt` or `planets.txt`), pero +*no* contienen la palabra `net`? +Después de pensar en tu respuesta, puedes probar los comandos en el directorio `data-shell`. + +1. `find data -name '*s.txt' | grep -v net` +2. `find data -name *s.txt | grep -v net` +3. `grep -v "temp" $(find data -name '*s.txt')` +4. Ninguna de las anteriores. + +::::::::::::::: solution + +## Solución + +La respuesta correcta es 1. Poniendo la expresión entre comillas, evita que el shell +la expanda, y luego lo pasa al comando `find`. + +La opción 2 es incorrecta porque el shell expande `*s.txt` en lugar de mandar el nombre correcto al +`find`. + +La opción 3 es incorrecta porque busca en los contenidos de los archivos las líneas que +no coinciden con "temp", en lugar de buscar los nombres de los archivos. + + + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::::: callout + +## Archivos binarios + +Nos hemos centrado exclusivamente en encontrar cosas en archivos de texto. ¿Y si +sus datos se almacenan como imágenes, en bases de datos, o en algún otro formato? +Una opción sería extender herramientas como `grep` para manejar esos formatos. +Esto no ha sucedido, y probablemente no se hará, porque hay demasiados +formatos disponibles. + +La segunda opción es convertir los datos en texto, o extraer los +bits de texto de los datos. Este es probablemente el enfoque más común, +ya que sólo requiere generar una herramienta por formato de datos (para +extraer información). Por un lado, facilita realizar las cosas simples. +Por el contrario, las cosas complejas son generalmente imposibles. Por +ejemplo, es bastante fácil escribir un programa que extraiga las dimensiones X, Y +de los archivos de imagen para que podamos después usar `grep`, pero ¿cómo +escribir algo para encontrar valores en una hoja de cálculo cuyas celdas contienen +fórmulas? + +La tercera opción es reconocer que laterminal y el procesamiento de texto +tiene sus límites, y en caso necesario debes utilizar otro lenguaje de programación. +Sin embargo, el shell te seguirá siendo útil para realizar tareas de +procesamiento diarias. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +La terminal de Unix es más antiguo que la mayoría de las personas que lo usan. +Ha sobrevivido tanto tiempo porque es uno de los ambientes de programación más productivos +jamás creados --- quizás incluso *el* más productivo. Su sintaxis +puede ser críptica, pero las personas que lo dominan pueden experimentar con +diferentes comandos interactivamente, y luego utilizar lo que han aprendido para +automatizar su trabajo. Las interfaces gráficas de usuario pueden ser más sencillas +al principio, pero el shell sigue invicto en segunda instancia. Y como Alfred +North Whitehead escribió en 1911, "La civilización avanza extendiendo el +número de operaciones importantes que podemos realizar sin pensar +en ellas." + +::::::::::::::::::::::::::::::::::::::: challenge + +## `find` Comprensión de lectura de pipeline + +Escribe un breve comentario explicativo para el siguiente **script** de shell: + +```bash +wc -l $(find . -name '*.dat') | sort -n +``` + +::::::::::::::: solution + +## Solución + +1. Encuentra todos los archivos con una extensión `.dat` en el directorio actual +2. Cuenta el número de líneas que contiene cada uno de estos archivos +3. Ordena la salida del paso 2. numéricamente + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +::::::::::::::::::::::::::::::::::::::: challenge + +## Búsqueda de archivos con propiedades diferentes + +El comando `find` puede recibir varios otros criterios conocidos como "tests" +para localizar archivos con atributos específicos, como tiempo de creación, tamaño, +permisos o dueño. Explora el manual con `man find` y luego +escribe un solo comando para encontrar todos los archivos en o debajo del directorio actual +que han sido modificados por el usuario `ahmed` en las últimas 24 horas. + +Sugerencia 1: necesitarás utilizar tres tests: `-type`,` -mtime` y `-user`. + +Sugerencia 2: El valor de `-mtime` tendrá que ser negativo --- ¿por qué? + +::::::::::::::: solution + +## Solución: + +Asumiendo que el directorio de inicio de Nelle es nuestro directorio en el que trabajamos, podemos usar: + +```bash +$ find ./ -type f -mtime -1 -user ahmed +``` + +::::::::::::::::::::::::: + +:::::::::::::::::::::::::::::::::::::::::::::::::: + + + +:::::::::::::::::::::::::::::::::::::::: keypoints + +- `find` encuentra archivos con propiedades específicas que coinciden con los patrones especificados. +- `grep` selecciona líneas en archivos que coinciden con los patrones especificados. +- `--help` es un indicador usado por muchos comandos bash y programas que se pueden ejecutar desde dentro de Bash, se usa para mostrar más información sobre cómo usar estos comandos o programas. +- `man command` muestra la página del manual de un comando. +- `$(comando)` contiene la salida de un comando. + +:::::::::::::::::::::::::::::::::::::::::::::::::: + + diff --git a/CODE_OF_CONDUCT.md b/CODE_OF_CONDUCT.md new file mode 100644 index 00000000..f19b8049 --- /dev/null +++ b/CODE_OF_CONDUCT.md @@ -0,0 +1,13 @@ +--- +title: "Contributor Code of Conduct" +--- + +As contributors and maintainers of this project, +we pledge to follow the [The Carpentries Code of Conduct][coc]. + +Instances of abusive, harassing, or otherwise unacceptable behavior +may be reported by following our [reporting guidelines][coc-reporting]. + + +[coc-reporting]: https://docs.carpentries.org/topic_folders/policies/incident-reporting.html +[coc]: https://docs.carpentries.org/topic_folders/policies/code-of-conduct.html diff --git a/LICENSE.md b/LICENSE.md new file mode 100644 index 00000000..7632871f --- /dev/null +++ b/LICENSE.md @@ -0,0 +1,79 @@ +--- +title: "Licenses" +--- + +## Instructional Material + +All Carpentries (Software Carpentry, Data Carpentry, and Library Carpentry) +instructional material is made available under the [Creative Commons +Attribution license][cc-by-human]. The following is a human-readable summary of +(and not a substitute for) the [full legal text of the CC BY 4.0 +license][cc-by-legal]. + +You are free: + +- to **Share**---copy and redistribute the material in any medium or format +- to **Adapt**---remix, transform, and build upon the material + +for any purpose, even commercially. + +The licensor cannot revoke these freedoms as long as you follow the license +terms. + +Under the following terms: + +- **Attribution**---You must give appropriate credit (mentioning that your work + is derived from work that is Copyright (c) The Carpentries and, where + practical, linking to ), provide a [link to the + license][cc-by-human], and indicate if changes were made. You may do so in + any reasonable manner, but not in any way that suggests the licensor endorses + you or your use. + +- **No additional restrictions**---You may not apply legal terms or + technological measures that legally restrict others from doing anything the + license permits. With the understanding that: + +Notices: + +* You do not have to comply with the license for elements of the material in + the public domain or where your use is permitted by an applicable exception + or limitation. +* No warranties are given. The license may not give you all of the permissions + necessary for your intended use. For example, other rights such as publicity, + privacy, or moral rights may limit how you use the material. + +## Software + +Except where otherwise noted, the example programs and other software provided +by The Carpentries are made available under the [OSI][osi]-approved [MIT +license][mit-license]. + +Permission is hereby granted, free of charge, to any person obtaining a copy of +this software and associated documentation files (the "Software"), to deal in +the Software without restriction, including without limitation the rights to +use, copy, modify, merge, publish, distribute, sublicense, and/or sell copies +of the Software, and to permit persons to whom the Software is furnished to do +so, subject to the following conditions: + +The above copyright notice and this permission notice shall be included in all +copies or substantial portions of the Software. + +THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR +IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY, +FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE +AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER +LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, +OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE +SOFTWARE. + +## Trademark + +"The Carpentries", "Software Carpentry", "Data Carpentry", and "Library +Carpentry" and their respective logos are registered trademarks of [Community +Initiatives][ci]. + +[cc-by-human]: https://creativecommons.org/licenses/by/4.0/ +[cc-by-legal]: https://creativecommons.org/licenses/by/4.0/legalcode +[mit-license]: https://opensource.org/licenses/mit-license.html +[ci]: https://communityin.org/ +[osi]: https://opensource.org diff --git a/config.yaml b/config.yaml new file mode 100644 index 00000000..d2b686ae --- /dev/null +++ b/config.yaml @@ -0,0 +1,87 @@ +#------------------------------------------------------------ +# Values for this lesson. +#------------------------------------------------------------ + +# Which carpentry is this (swc, dc, lc, or cp)? +# swc: Software Carpentry +# dc: Data Carpentry +# lc: Library Carpentry +# cp: Carpentries (to use for instructor training for instance) +# incubator: The Carpentries Incubator +carpentry: 'swc' + +# Overall title for pages. +title: 'La Terminal de Unix' + +# Date the lesson was created (YYYY-MM-DD, this is empty by default) +created: '2018-02-20' + +# Comma-separated list of keywords for the lesson +keywords: 'software, data, lesson, The Carpentries' + +# Life cycle stage of the lesson +# possible values: pre-alpha, alpha, beta, stable +life_cycle: 'stable' + +# License of the lesson materials (recommended CC-BY 4.0) +license: 'CC-BY 4.0' + +# Link to the source repository for this lesson +source: 'https://github.com/swcarpentry/shell-novice-es' + +# Default branch of your lesson +branch: 'main' + +# Who to contact if there are any issues +contact: 'team@carpentries.org' + +# Navigation ------------------------------------------------ +# +# Use the following menu items to specify the order of +# individual pages in each dropdown section. Leave blank to +# include all pages in the folder. +# +# Example ------------- +# +# episodes: +# - introduction.md +# - first-steps.md +# +# learners: +# - setup.md +# +# instructors: +# - instructor-notes.md +# +# profiles: +# - one-learner.md +# - another-learner.md + +# Order of episodes in your lesson +episodes: +- 01-intro.md +- 02-filedir.md +- 03-create.md +- 04-pipefilter.md +- 05-loop.md +- 06-script.md +- 07-find.md + +# Information for Learners +learners: + +# Information for Instructors +instructors: + +# Learner Profiles +profiles: + +# Customisation --------------------------------------------- +# +# This space below is where custom yaml items (e.g. pinning +# sandpaper and varnish versions) should live + + +url: 'https://swcarpentry.github.io/shell-novice-es' +analytics: carpentries +lang: 'es' diff --git a/data/shell-novice-data.zip b/data/shell-novice-data.zip new file mode 100644 index 00000000..b8a3ffee Binary files /dev/null and b/data/shell-novice-data.zip differ diff --git a/discuss.md b/discuss.md new file mode 100644 index 00000000..d7d18638 --- /dev/null +++ b/discuss.md @@ -0,0 +1,759 @@ +--- +title: Discussion +--- + +## Sopa de letras + +Si el comando para averiguar quiénes somos es `whoami`, el comando para encontrar +donde deberíamos llamarnos `whereami`, ¿por qué es `pwd` +¿en lugar? La respuesta habitual es que a principios de la década de 1970, cuando Unix era +primero en desarrollo, cada tecla contada: los dispositivos del día +fueron lentos, y retroceder en un teletipo fue tan doloroso que cortar el +número de teclas para cortar el número de errores de tipeo fue +de hecho una victoria para la usabilidad. La realidad es que los comandos se agregaron a +Unix uno por uno, sin ningún plan maestro, por personas que estaban inmersas en +su jerga. El resultado es tan inconsistente como el roolz uv Inglish +Spelling, pero estamos atrapados con eso ahora. + +## Códigos de control de trabajo + +La terminal acepta algunos comandos especiales que permiten a los usuarios interactuar +con procesos o programas en ejecución. Puedes ingresar cada uno de estos +"códigos de control" presionando la tecla `Ctrl` y luego presionando uno +de los personajes de control. En otros tutoriales, puede ver el término +`Control` o `^` usado para representar la tecla `Ctrl` (por ejemplo, +Los siguientes son equivalentes "Ctrl-C", "Ctrl + C", "Control-C", "Control + C", "^ C". + +- `Ctrl-C`: +     interrumpe y cancela un programa en ejecución. +     Esto es útil si desea cancelar un comando que tarda demasiado en ejecutarse. + +- `Ctrl-D`: +     indica el final de un archivo o secuencia de caracteres que está ingresando en la línea de comando. +     Por ejemplo, vimos anteriormente que el comando `wc` cuenta líneas, palabras y caracteres en un archivo. +     Si simplemente escribimos `wc` y presionamos la tecla Enter sin proporcionar un nombre de archivo, +     entonces `wc` supondrá que queremos analizar todas las cosas que escribimos a continuación. +     Después de escribir nuestro magnum opus directamente en el intérprete de comandos del terminal, +     entonces podemos escribir Ctrl-D para decir `wc` que hemos terminado y nos gustaría ver los resultados del conteo de palabras. + +- `Ctrl-Z`: +     Suspende un proceso pero no lo finaliza. +     A continuación, puede utilizar el comando `fg` para reiniciar el trabajo en primer plano. + +Para los nuevos usuarios de terminal, todos estos códigos de control pueden parecer tener +el mismo efecto: hacen que las cosas "se vayan". Pero es útil +entiende las diferencias. En general, si algo salió mal y +solo quiere recuperar su mensaje de shell, es mejor usar +`Ctrl-C`. + +## Otras terminals + +Antes de que Bash se hiciera popular a fines de los años noventa, los científicos ampliamente +utilizado (y algunos todavía usan) otro terminal, C-shell o Csh. Bash y Csh +tienen conjuntos de características similares, pero sus reglas de sintaxis son diferentes y +esto los hace incompatibles entre sí. Algunas otras terminals tienen +apareció desde entonces, incluyendo ksh, zsh y un número de otros; son +mayormente compatible con Bash, y Bash es la terminal que se selecciona automáticamente en la mayoría +implementaciones modernas de Unix (incluida la mayoría de los paquetes que proporcionan +herramientas tipo Unix para Windows) pero si obtiene errores extraños en la terminal +guiones escritos por colegas, compruebe para ver qué terminal eran +escrito para. + +## Bash Configuraciones + +Desea personalizar rutas, variables de entorno, alias, +y otros comportamientos de tu termianl? +Esta excelente publicación de blog "[Bash Configurations Demystified] [bash-demystified]" +de Dalton Hubble +cubre consejos, trucos y cómo evitar peligros. + +## Permisos + +Unix controla quién puede leer, modificar y ejecutar archivos usando *permisos*. +Discutiremos cómo maneja Windows los permisos al final de la sección: +los conceptos son similares, +pero las reglas son diferentes. + +Comencemos con Nelle. +Ella tiene un nombre de usuario único, +`nelle.nemo`, +Y un ID de usuario, +1404\. + +::::::::::::::::::::::::::::::::::::::::: callout + +## ¿Por qué IDs con números enteros? + +¿Por qué usar enteros para IDs? +Una vez más, la respuesta se remonta a principios de los años setenta. +Las cadenas de caracteres como `alan.turing` son de longitud variable, +y comparar una a otro toma muchas instrucciones. +Enteros, +por otra parte, +utilizan una cantidad bastante pequeña de almacenamiento (normalmente cuatro caracteres), +y puede ser comparados con una sola instrucción. +Para hacer operaciones rápidas y sencillas, +los programadores suelen realizar un seguimiento de las cosas internamente usando números enteros, +luego utilizan una tabla de búsqueda de algún tipo +para traducir esos números enteros en un texto fácil de usar para su presentación. +Por supuesto, +los programadores siendo programadores, +a menudo se saltarán la parte de usar el texto +y sólo utilizan los enteros, +de la misma manera que alguien que trabaja en un laboratorio podría hablar del Experimento 28 +en lugar de "los ensayos cronotípicos de respuesta alfa en anacondas". + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +Los usuarios pueden pertenecer a cualquier número de grupos, +cada uno de los cuales tiene un nombre de grupo único +y un identificador numérico o ID de grupo. +La lista de quién está en qué grupo se almacena normalmente en el archivo `/etc/group`. +(si está delante de una máquina Unix en este momento, +intente ejecutar `cat /etc/group` para ver ese archivo.) + +Ahora veamos archivos y directorios. +Cada archivo y directorio en un equipo Unix pertenece a un propietario y un grupo. +Junto con el contenido de cada archivo, +el sistema operativo almacena los ID numéricos del usuario y del grupo que lo posee. + +El modelo de usuario y grupo significa que +para cada archivo +cada usuario en el sistema cae en una de tres categorías: + +1. el propietario del archivo, +2. alguien en el grupo del archivo, y +3. todos los demás. + +Para cada una de estas tres categorías, +la computadora realiza un seguimiento de +si las personas de esa categoría pueden leer el archivo, +escribir en el archivo, +o ejecutar el archivo +(es decir, ejecutarlo si es un programa). + +Por ejemplo, si un archivo tuviera el siguiente conjunto de permisos: + + + + + + +
usergroupall
readyesyesno
writeyesnono
executenonono
+ +esto significaría que: + +- el propietario del archivo puede leerlo y escribirlo, pero no ejecutarlo; +- otras personas del grupo del archivo pueden leerlo, pero no modificarlo o ejecutarlo; y +- otras personas (no el grupo ni el propietario) no pueden hacer nada con él en absoluto. + +Veamos este modelo en acción. +Si usamos `cd` en el directorio `labs` y ejecutamos `ls -F`, +pone un `*` al final del nombre de `setup`. +Esta es su forma de decirnos que `setup` es ejecutable, +es decir, +que es (probablemente) algo que el ordenador puede ejecutar. + +```bash +$ cd labs +$ ls -F +``` + +```output +safety.txt setup* waiver.txt +``` + +::::::::::::::::::::::::::::::::::::::::: callout + +## Necesario pero no suficiente + +El hecho de que algo este marcado como ejecutable +en realidad no significa que contiene un programa de algún tipo. +Podríamos marcar fácilmente este archivo HTML (de esta página) como ejecutable +utilizando los comandos que se presentan a continuación. +Dependiendo del sistema operativo que utilicemos, +tratar de "ejecutarlo" no funcionará +(porque no contiene instrucciones que la computadora reconozca) +o puede hacer que el sistema operativo abra el archivo +con cualquier aplicación que normalmente lo maneja +(como un navegador web). + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +Ahora vamos a ejecutar el comando `ls -l`: + +```bash +$ ls -l +``` + +```output +-rw-rw-r-- 1 vlad bio 1158 2010-07-11 08:22 safety.txt +-rwxr-xr-x 1 vlad bio 31988 2010-07-23 20:04 setup +-rw-rw-r-- 1 vlad bio 2312 2010-07-11 08:23 waiver.txt +``` + +La opción `-l` le dice a `ls` que nos de una lista larga. +Es una gran cantidad de información, así que vamos a explicar las columnas una a la vez. + +En el lado derecho, tenemos los nombres de los archivos. +junto a ellos, +moviéndose a la izquierda, +están los tiempos y fechas en que fueron modificados por última vez. +Los sistemas de respaldo y otras herramientas utilizan esta información de varias maneras, +pero tú puedes utilizarlo para saber cuando tú (o cualquier otra persona con permiso) +realizó la última modificación de un archivo. + +Junto al tiempo de modificación se encuentra el tamaño del archivo en bytes +y los nombres del usuario y del grupo que lo posee +(en este caso, «vlad» y «bio», respectivamente). +Pasaremos por alto la segunda columna por ahora +(que muestra `1` para cada archivo) +porque es la primera columna la que nos concierne. +Esta muestra los permisos del archivo, es decir, quién lo puede leer, escribir o ejecutar. + +Echemos un vistazo a una de esas cadenas de permisos: +`-rwxr-xr-x`. +El primer carácter nos dice qué tipo de cosa es esta: +'-' significa que es un archivo regular, +mientras que 'd' significa que es un directorio, +y otros caracteres significan cosas más esotéricas. + +Los siguientes tres caracteres nos dicen qué permisos tiene el propietario del archivo. +En este caso, el propietario puede leer, escribir y ejecutar el archivo: `rwx`. +El triplete medio nos muestra los permisos del grupo. +Si el permiso está desactivado, vemos un guión, por lo que `r-x` significa "leer y ejecutar, pero no escribir". +El triplete final nos muestra lo que pueden hacer todos los que no son propietarios del archivo o no están en el grupo del archivo. +En este caso, es 'r-x' de nuevo, por lo que todo el mundo en el sistema puede ver el contenido del archivo y ejecutarlo. + +Para cambiar los permisos, usamos el comando `chmod` +(cuyo nombre significa "modo de cambio" (change mode)). +Aquí está un listado de formato largo que muestra los permisos de las calificaciones finales del curso que Vlad está enseñando: + +```bash +$ ls -l final.grd +``` + +```output +-rwxrwxrwx 1 vlad bio 4215 2010-08-29 22:30 final.grd +``` + +Ups: todo el mundo puede leerlo, y lo que es peor, +modificarlo +(también podrían tratar de ejecutar el archivo de calificaciones como un programa, +lo que casi con seguridad no funcionaría.) + +El comando para cambiar los permisos del propietario a `rw-` es: + +```bash +$ chmod u=rw final.grd +``` + +La 'u' señala que estamos cambiando los privilegios +del usuario (es decir, el propietario del archivo), +y `rw` es el nuevo conjunto de permisos. +Un rápido `ls -l` nos muestra que funcionó, +ya que los permisos del propietario ahora están configurados para leer y escribir (pero no para ejecutar): + +```bash +$ ls -l final.grd +``` + +```output +-rw-rwxrwx 1 vlad bio 4215 2010-08-30 08:19 final.grd +``` + +Vamos a ejecutar `chmod` de nuevo para dar al grupo permisos de sólo lectura: + +```bash +$ chmod g=r final.grd +$ ls -l final.grd +``` + +```output +-rw-r--rw- 1 vlad bio 4215 2010-08-30 08:19 final.grd +``` + +Y finalmente, +vamos a quitarles los permisos a "todos" (todos en el sistema que no son ni el propietario del archivo o están su grupo): + +```bash +$ chmod a= final.grd +$ ls -l final.grd +``` + +```output +-rw-r----- 1 vlad bio 4215 2010-08-30 08:20 final.grd +``` + +La 'a' indica que estamos cambiando permisos para "todos", +y, puesto que no hay nada a la derecha del "=", +los nuevos permisos de "todos" están vacíos. + +También podemos buscar por permisos. +Aquí, por ejemplo, podemos usar `-type f -perm -u=x` para encontrar archivos +que el usuario puede ejecutar: + +```bash +$ find . -type f -perm -u=x +``` + +```output +./tools/format +./tools/stats +``` + +Antes de ir más lejos, +Vamos a ejecutar `ls -a -l` +Para obtener un listado de formulario largo que incluye entradas de directorio que normalmente están ocultas: + +```bash +$ ls -a -l +``` + +```output +drwxr-xr-x 1 vlad bio 0 2010-08-14 09:55 . +drwxr-xr-x 1 vlad bio 8192 2010-08-27 23:11 .. +-rw-rw-r-- 1 vlad bio 1158 2010-07-11 08:22 safety.txt +-rwxr-xr-x 1 vlad bio 31988 2010-07-23 20:04 setup +-rw-rw-r-- 1 vlad bio 2312 2010-07-11 08:23 waiver.txt +``` + +Los permisos para `.` y `..` (este directorio y su padre) comienzan con un 'd'. +pero mira el resto de sus permisos: +La 'x' significa que "ejecutar" está activado. +¿Qué significa eso? +Un directorio no es un programa, ¿cómo podemos "ejecutarlo"? + +De hecho, 'x' significa algo diferente para los directorios. +Da a alguien el derecho a *recorrer* el directorio, pero no a mirar su contenido. +La distinción es sutil, así que echemos un vistazo a un ejemplo. +El directorio de inicio de Vlad tiene tres subdirectorios llamados `venus`, `mars` y `pluto`: + +![](fig/x-for-directories.svg){alt='Permisos de ejecución para directorios'} + +Cada uno de ellos tiene un subdirectorio llamado `notes`, +y esos subdirectorios contienen varios archivos. +Si los permisos de un usuario en `venus` son 'r-x', +entonces si ella trata de ver el contenido de `venus` y `venus/notes `usando` ls`, +la computadora le permite ver ambos. +Si sus permisos en `mars` son sólo 'r--', +entonces se le permite leer el contenido de `mars` y `mars/notes`. +Pero si sus permisos en `pluto` son sólo '-x', +No puede ver lo que hay en el directorio `pluto`: +`ls pluto` le dirá que no tiene permiso para ver su contenido. +Si ella trata de mirar en `pluto/notas`, sin embargo, la computadora se lo permitirá. +Se le permite pasar por `pluto`, pero no para mirar lo que hay. +Este truco da a la gente una forma de hacer que algunos de sus directorios sean visibles para todos +sin abrir todo lo demás. + +#### ¿Qué hay de Windows? + +Estos son los conceptos básicos de los permisos en Unix. +Como dijimos al principio, sin embargo, las cosas funcionan de manera diferente en Windows. +Allí, los permisos están definidos por listas de control de acceso, +o ACL. +Una ACL es una lista de pares, cada uno de los cuales combina un "quién" con un "qué". +Por ejemplo, +tú podrías dar a la Antonio permiso para agregar datos a un archivo sin darle permiso para leerlo o borrarlo, +y dar permiso a Tania para borrar un archivo sin poder ver lo que contiene. + +Esto es más flexible que el modelo Unix, +pero también es más complejo de administrar y entender en sistemas pequeños +(si tú tienes un sistema de computadora grande, +*nada* es fácil de administrar o entender). +Algunas variantes modernas de Unix aceptan ACL, así como los permisos antiguos de lectura-escritura-ejecución, +pero casi nadie los utiliza. + +::::::::::::::::::::::::::::::::::::::: challenge + +## Challenge + +Si `ls -l myfile.php` devuelve los siguientes detalles: + +```output +-rwxr-xr-- 1 caro zoo 2312 2014-10-25 18:30 myfile.php +``` + +¿Cuál de las siguientes afirmaciones es verdadera? + +1. caro (el propietario) puede leer, escribir y ejecutar myfile.php +2. caro (el propietario) no puede escribir en myfile.php +3. Los miembros de caro (un grupo) pueden leer, escribir y ejecutar myfile.php +4. Los miembros de zoo (un grupo) no pueden ejecutar myfile.php + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + +## Blast en la línea de comandos + +[Blast](https://es.wikipedia.org/wiki/BLAST) es uno de los programas de alineamiento +de secuencias más populares. Se utiliza +para buscar similitud (homología) entre distintas secuencias +generando alineamientos locales de manera heurística. De hecho es tan popular +que las publicaciones que lo describen figuran entre los 20 +artículos más citados del [mundo](https://www.nature.com/news/the-top-100-papers-1.16224). + +### Configurando Blast + +Instalamos Blast previamente en nuestro proceso de preparación para esta lección. +Verifiquemos que nuestra instalación de Blast funcionó correctamente escribiendo: + +```bash +blastn +``` + +o en Windows: + +```bash +blastn.exe +``` + +Si obtienes la siguiente salida, tu programa está bien configurado: + +```output +BLAST query/options error: Either a BLAST database or subject sequence(s) must be specified +``` + +Primero creemos un directorio para almacenar nuestras bases de datos de blast: + +```bash +mkdir $HOME/blastdb +``` + +Movamos el archivo de nuestra base de datos a ese directorio: + +```bash +mv uniprot_sprot.fasta $HOME/blastdb/ +cd $HOME/blastdb +``` + +Y cambiemos el formato de la base de datos que descargamos de [Uniprot](https://www.uniprot.org/) +para que Blast pueda usarla como datos de búsqueda. + +```bash +makeblastdb -in uniprot_sprot.fasta -dbtype prot +``` + +Ahora, vamos a configurar la **variable de entorno** que especifica +en dónde se encuentra nuestra base de datos de Blast + +```bash +export BLASTDB=$HOME/blastdb +``` + +¡Estamos listos! + +### Usando Blast + +Blast acepta como entrada un archivo tipo fasta similar a este: + +```output +>MIMI_L4 complement(6238..7602) +MPQKTSKSKSSRTRYIEDSDDETRGRSRNRSIEKSRSRSLDKSQKKSRDK +SLTRSRSKSPEKSKSRSKSLTRSRSKSPKKCITGNRKNSKHTKKDNEYTT +EESDEESDDESDGETNEESDEELDNKSDGESDEEISEESDEEISEESDED +VPEEEYDDNDIRNIIIENINNEFARGKFGDFNVIIMKDNGFINATKLCKN +``` + +Blast cuenta con varios algoritmos que le permiten hacer búsquedas distintas: + +1. **blastn** - consulta de nucleótidos vs base de datos de nucleótidos +2. **blastp** - consulta de proteínas vs base de datos de proteínas +3. **blastx** - consulta de nucleótidos traducidos a 6 marcos de lectura vs base de datos de proteínas +4. **tblastn** - consulta de proteínas vs base de datos de nucleótidos traducidos a 6 marcos de lectura +5. **tblastx** - consulta de nucleótidos traducidos a 6 marcos de lectura vs base de datos de nucleótidos traducidos a 6 marcos de lectura +6. **megaBlast** - búsqueda ultra rápida para ADN de alta similitud (95%) +7. **psiblast** - búsqueda iterativa de secuencias similares + +Podemos explorar sus opciones usando: + +```bash +blastn -h +``` + +```output +USAGE + blastn [-h] [-help] [-import_search_strategy filename] + [-export_search_strategy filename] [-task task_name] [-db database_name] + [-dbsize num_letters] [-gilist filename] [-seqidlist filename] + [-negative_gilist filename] [-entrez_query entrez_query] + [-db_soft_mask filtering_algorithm] [-db_hard_mask filtering_algorithm] + [-subject subject_input_file] [-subject_loc range] [-query input_file] + [-out output_file] [-evalue evalue] [-word_size int_value] + [-gapopen open_penalty] [-gapextend extend_penalty] + [-perc_identity float_value] [-qcov_hsp_perc float_value] + [-max_hsps int_value] [-xdrop_ungap float_value] [-xdrop_gap float_value] + [-xdrop_gap_final float_value] [-searchsp int_value] + [-sum_stats bool_value] [-penalty penalty] [-reward reward] [-no_greedy] + [-min_raw_gapped_score int_value] [-template_type type] + [-template_length int_value] [-dust DUST_options] + [-filtering_db filtering_database] + [-window_masker_taxid window_masker_taxid] + [-window_masker_db window_masker_db] [-soft_masking soft_masking] + [-ungapped] [-culling_limit int_value] [-best_hit_overhang float_value] + [-best_hit_score_edge float_value] [-window_size int_value] + [-off_diagonal_range int_value] [-use_index boolean] [-index_name string] + [-lcase_masking] [-query_loc range] [-strand strand] [-parse_deflines] + [-outfmt format] [-show_gis] [-num_descriptions int_value] + [-num_alignments int_value] [-line_length line_length] [-html] + [-max_target_seqs num_sequences] [-num_threads int_value] [-remote] + [-version] + +DESCRIPTION + Nucleotide-Nucleotide BLAST 2.5.0+ + +Use '-help' to print detailed descriptions of command line arguments +``` + +Esto nos permitirá usar más opciones de Blast. + +Entremos a nuestro directorio de trabajo: + +```bash +cd ~/data-shell +mkdir blast_analysis +cd blast_analysis +``` + +## Un ejemplo de Blast + +Examinemos un ejemplo de una búsqueda usando Blast. Este es el tipo de salida que se genera +por defecto: + +```output +>ref|NM_009586.1| UniGene infoGeoGene info Homo sapiens single-minded homolog 2 (Drosophila) (SIM2), transcript +variant SIM2s, mRNA +Length=2823 + + Score = 329 bits (178), Expect = 6e-87 + Identities = 253/288 (87%), Gaps = 9/288 (3%) + Strand=Plus/Plus + +Query 6378 GTGGCTCACGCCTGTAATCCCAGCACTTTGGGAGGCCAAGGTGGGCAGATCAC-TGGAGG 6436 + ||||||||| |||||||||||||||||||||||||||||||||||| |||||| || ||| +Sbjct 2541 GTGGCTCACACCTGTAATCCCAGCACTTTGGGAGGCCAAGGTGGGCGGATCACCTG-AGG 2599 + +Query 6437 TCAGGAGTTCGAAACCAGCCTGGCCAACATGGTGAAACCCCATCTCTACTAAAAATACAG 6496 + ||||||||| | || |||||| |||||| | |||||||||||||| |||||||||||| +Sbjct 2600 TCAGGAGTTTGCGACAAGCCTG-CCAACAAGCTGAAACCCCATCTCCACTAAAAATACAA 2658 + +Query 6497 AAATTAGCCGGTCATGGTGGTG-GACACCTGTAATCCCAGCTACTCAGGTGGCTAAGGCA 6555 + ||||||| || |||||||||| | ||||||||||||||||||||| || |||| || | +Sbjct 2659 AAATTAGTTGGGCATGGTGGTGAG-CACCTGTAATCCCAGCTACTCTGGAGGCTGAGATA 2717 + +Query 6556 GGAGAATCACTTCAGCCCGGGAGGTGGAGGTTGCAGTGAGCCAAGATCATACCACGGCAC 6615 + |||| ||||||| | |||||||||||||||||||||||||| ||||||| | ||| |||| +Sbjct 2718 GGAGGATCACTTGAACCCGGGAGGTGGAGGTTGCAGTGAGCTAAGATCACATCACTGCAC 2777 + +Query 6616 TCCAGCCTGGGTGACAG--TGAGACTGTGGCTCAAAAAAAAAAAAAAA 6661 + |||||||||||| |||| ||||||||| |||||||||||||||||| +Sbjct 2778 TCCAGCCTGGGTAACAGAGTGAGACTGT--CTCAAAAAAAAAAAAAAA 2823 +``` + +Podemos ver que hay nucleótidos idénticos entre estas dos secuencias +(denotados por el símbolo '|'), así como nucleótidos diferentes (donde no hay +similitud), así como inserciones y deleciones (denotadas por guiones '-'). Al principio +y al final de cada línea del alineamiento se marcan las posiciones de inicio y término +en la secuencia de interés (**query**) así como en la secuencia encontrada (**subject**). + +A pesar de que es muy informativa si tenemos una sola secuencia, no lo es tanto cuando hay +muchas secuencias que queremos analizar, por ello en el siguiente ejercicio usaremos un +formato diferente. + +## Usando Blast + +Realicemos una búsqueda usando Blast. Vamos a descargar el siguiente archivo [fasta](https://www.uniprot.org/uniprot/P38398.fasta). + +```bash +wget http://www.uniprot.org/uniprot/P38398.fasta +``` + +```output +Resolving www.uniprot.org... 128.175.240.211, 193.62.193.81 +Connecting to www.uniprot.org|128.175.240.211|:80... connected. +HTTP request sent, awaiting response... 200 OK +Length: 1997 (2.0K) [text/plain] +Saving to: 'P38398.fasta' + +P38398.fasta 100%[===============================================================>] 1.95K --.-KB/s in 0s + +2017-01-13 00:07:01 (54.4 MB/s) - 'P38398.fasta' saved [1997/1997] +``` + +Y veamos las primeras líneas: + +```bash +head P38398.fasta +``` + +```output +>sp|P38398|BRCA1_HUMAN Breast cancer type 1 susceptibility protein OS=Homo sapiens GN=BRCA1 PE=1 SV=2 +MDLSALRVEEVQNVINAMQKILECPICLELIKEPVSTKCDHIFCKFCMLKLLNQKKGPSQ +CPLCKNDITKRSLQESTRFSQLVEELLKIICAFQLDTGLEYANSYNFAKKENNSPEHLKD +EVSIIQSMGYRNRAKRLLQSEPENPSLQETSLSVQLSNLGTVRTLRTKQRIQPQKTSVYI +ELGSDSSEDTVNKATYCSVGDQELLQITPQGTRDEISLDSAKKAACEFSETDVTNTEHHQ +PSNNDLNTTEKRAAERHPEKYQGSSVSNLHVEPCGTNTHASSLQHENSSLLLTKDRMNVE +KAEFCNKSKQPGLARSQHNRWAGSKETCNDRRTPSTEKKVDLNADPLCERKEWNKQKLPC +SENPRDTEDVPWITLNSSIQKVNEWFSRSDELLGSDDSHDGESESNAKVADVLDVLNEVD +EYSGSSEKIDLLASDPHEALICKSERVHSKSVESNIEDKIFGKTYRKKASLPNLSHVTEN +LIIGAFVTEPQIIQERPLTNKLKRKRRPTSGLHPEDFIKKADLAVQKTPEMINQGTNQTE +``` + +Y le vamos a cambiar el nombre: + +```bash +mv P38398.fasta BRCA1_HUMAN.fasta +``` + +Ejecutemos nuestra primera búsqueda de Blast usando el siguiente comando: + +```bash +blastp -query BRCA1_HUMAN.fasta -db uniprot_sprot.fasta -outfmt 7 -max_target_seqs 5 +``` + +¿Qué significa cada una de las opciones que utilizamos? + +- `-query` se refiere al archivo con la secuencia a la cual le queremos encontrar secuencias homólogas. + Debe estar en formato fasta. +- `-db` Se refiere a la base de datos que queremos usar. +- `-outfmt` se refiere al formato de salida deseamos, en este caso el tipo 7, que es en columnas con + comentarios. +- `-max_target_seqs` Nos indica que se reportarán máximo 5 'hits' o secuencias similares a nuestra + secuencia de interés. Sólo se muestran las 5 secuencias con mayores niveles de identidad. + +¿Por qué utilizamos blastp? + +```output +# BLASTP 2.5.0+ +# Query: sp|P38398|BRCA1_HUMAN Breast cancer type 1 susceptibility protein OS=Homo sapiens GN=BRCA1 PE=1 SV=2 +# Database: uniprot_sprot.fasta +# Fields: query acc., subject acc., % identity, alignment length, mismatches, gap opens, q. start, q. end, s. start, s. end, evalue, bit score +# 5 hits found +sp|P38398|BRCA1_HUMAN sp|P38398|BRCA1_HUMAN 100.000 1863 0 0 1 1863 1 1863 0.0 3844 +sp|P38398|BRCA1_HUMAN sp|Q9GKK8|BRCA1_PANTR 98.443 1863 29 0 1 1863 1 1863 0.0 3773 +sp|P38398|BRCA1_HUMAN sp|Q6J6I8|BRCA1_GORGO 98.014 1863 37 0 1 1863 1 1863 0.0 3757 +sp|P38398|BRCA1_HUMAN sp|Q6J6J0|BRCA1_PONPY 96.833 1863 59 0 1 1863 1 1863 0.0 3699 +sp|P38398|BRCA1_HUMAN sp|Q6J6I9|BRCA1_MACMU 93.026 1864 128 2 1 1863 1 1863 0.0 3504 +# BLAST processed 1 queries +``` + +La salida nos muestra las 5 secuencias con mayor identidad a nuestra secuencia de interés, así como +información acerca de cada una de estas secuencias: + +1. `query acc.` - El nombre de nuestra secuencia de interés. +2. `subject acc.` - El nombre de la secuencia con identidad a nuestra secuencia de interés. +3. `% identity` - El porcentaje de identidad. +4. `alignment length` - La longitud del alineamiento. +5. `mismatches` - El número de posiciones diferentes (**mismatches**). +6. `gap opens` - El número de gaps. +7. `q. start` - La posición de inicio en nuestra secuencia de interés. +8. `q. end` - La posición de término en nuestra secuencia de interés. +9. `s. start` - La posición de inicio en la secuencia en la base de datos. +10. `s. end` - La posición de término en la secuencia en la base de datos. +11. `evalue` - El **e-value**. +12. `bit score` - El **bit score**. + +Ahondemos un poco más en el significado de los últimos dos campos. + +# El e-value + +El valor esperado o **e-value** es el número de secuencias que obtendrían el mismo nivel de homología sólo por azar +dado el tamaño de la base de datos que estamos usando. Por lo tanto, mientras más cercano a +cero sea este valor, más significativo es, es decir, hay pocas posibilidades de que encontremos +un nivel de similitud de secuencias como el observado por azar. Por lo tanto, mientras más grande sea la base +de datos de secuencias que estamos usando, más significativos serán los valores esperados. + +Este valor se usa comúnmente para filtrar resultados de Blast y sólo obtener aquellos que +son probablemente debidos a que los organismos que las contienen comparten un ancestro común y +no al hecho de que tenemos una base de datos enorme. + +# El bit score + +El **bit score** sirve como indicador de qué tan bueno es un alineamiento, mientras más alto +sea esta métrica, mejor será el alineamiento. Este se calcula por medio de una fórmula que +toma en cuenta cuántos residuos similares existen en el alineamiento así como el número de gaps +en el mismo. Es comparable entre bases de datos de diferente tamaño. + +Hay muchas más opciones de Blast, para ello debes revisar el manual que ese encuentra en +NCBI - [https://www.ncbi.nlm.nih.gov/books/NBK279690/](https://www.ncbi.nlm.nih.gov/books/NBK279690/). + +## Proyecto Final Opcional + +Usando los comandos disponibles en esta lección deberán escribir un **script** que, +a partir únicamente de tres archivos fasta, genere la siguiente información. + +1. El nombre del archivo más largo (en número de caracteres). +2. Un archivo concatenado de todas las secuencias. +3. Un análisis de este archivo con: + 1. El numero de líneas en el archivo, + 2. El numero de caracteres en el archivo, + 3. El número total de secuencias, + 4. El nombre de la penúltima secuencia, + 5. El número de secuencias únicas (sin importar sus nombres). + +Por ejemplo: + +Dados los siguientes archivos fasta [Proteins\_1.fasta](files/final_project/example/Proteins_1.fasta), +[Proteins\_2.fasta](files/final_project/example/Proteins_2.fasta), [Proteins\_3.fasta](files/final_project/example/Proteins_3.fasta), + +```bash +bash fasta_analysis_script_ID.sh *.fasta +``` + +Generará el siguiente archivo [Complete\_ID.fasta](files/final_project/example/Complete_ID.fasta) e imprimirá en la terminal: + +```output +Longest file: Proteins_1.fasta +Concatenated file name: Complete_ID.fasta + +Analysis of Complete_ID.fasta + Number of lines: 600 + Number of characters: 207076 + Number of sequences: 300 + Name of second to last sequence: XP_012933189.1_PREDICTED:_calcium-binding_and_coiled-coil_domain-containing_protein_2_isoform_X2 + Number of unique sequences: 298 +``` + +- La descripciones en la salida deberán ser idénticas a las mostradas arriba. +- El **script** deberá imprimir a salida estándar. +- Deberá funcionar con cualquier otro archivo o archivos fasta, diferentes a los proporcionados. +- Deberá estar comentado, explicando brevemente qué hace el **script** y qué realiza cada línea. + +Todas las ocurrencias de 'ID' deberán ser substituidas por un identificador, pueden usar un número entre 1 y 16. No tienen que hacer este ID variable, es decir, no es necesario que el ID se pueda cambiar en la línea de comandos cuando se ejecuta el script. + +Los paquetes de archivos los pueden descargar de: + +`https://software-carpentry.github.io/shell-novice-es/final_project/data/Fastas_.tar.gz` + +Y descomprimirlos con tar de la siguiente manera, por ejemplo, para el estudiante con ID=1: + +```bash +tar -xvf Fastas_1.tar.gz +``` + +Éste generará un directorio llamado `Fastas_1` dentro del cual realizarán sus análisis. + +Se entregarán dos archivos: + +1. fasta\_analysis\_script\_``.sh (e.g. fasta\_analysis\_script\_5.sh) +2. Complete\_``.fasta (e.g. Complete\_5.fasta) + +#### Reto extra + +Intenta imprimir un menú de +ayuda si se ejecuta el **script** sin opciones. + +#### Tips + +Para borrar uno o más espacios al inicio de la línea se puede utilizar: + +```bash +sed 's/ *//' +``` + +[bash-demystified]: https://blog.dghubble.io/post/.bashprofile-.profile-and-.bashrc-conventions/ + + + diff --git a/fig/filesystem-challenge.odg b/fig/filesystem-challenge.odg new file mode 100644 index 00000000..c3bf2526 Binary files /dev/null and b/fig/filesystem-challenge.odg differ diff --git a/fig/filesystem-challenge.svg b/fig/filesystem-challenge.svg new file mode 100644 index 00000000..1b79540b --- /dev/null +++ b/fig/filesystem-challenge.svg @@ -0,0 +1,763 @@ + +image/svg+xml + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + Users + + + + + + + + + + + + + + thing + + + + + + + + + + + + + + backup + + + + + + + + + + + + + + 2012-12-01 + + + + + + + + + + + + + + 2013-01-08 + + + + + + + + + + + + + + 2013-01-27 + + + + + + + + + + + + + + backup + + + + + + + + + + + + + + original + + + + + + + + + + + + + + pnas_final + + + + + + + + + + + + + + pnas_sub + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + diff --git a/fig/filesystem.svg b/fig/filesystem.svg new file mode 100644 index 00000000..525ee068 --- /dev/null +++ b/fig/filesystem.svg @@ -0,0 +1,150 @@ + + + + + + + image/svg+xml + + + + + + + + + + + + + + + + + + + + Users + + + + + + + + + data + bin + tmp + /root + + diff --git a/fig/find-file-tree.odg b/fig/find-file-tree.odg new file mode 100644 index 00000000..38d3d8b6 Binary files /dev/null and b/fig/find-file-tree.odg differ diff --git a/fig/find-file-tree.svg b/fig/find-file-tree.svg new file mode 100644 index 00000000..d498a6ec --- /dev/null +++ b/fig/find-file-tree.svg @@ -0,0 +1,315 @@ + + + + + + + image/svg+xml + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + thesis + data + tools + writing + + + + + + + + + haiku.txt + + + + + + + + + empty-draft.md + + + + + format + stats + old + oldtool + + + + + + + + + two.txt + one.txt + + diff --git a/fig/home-directories.svg b/fig/home-directories.svg new file mode 100644 index 00000000..5e32fc3e --- /dev/null +++ b/fig/home-directories.svg @@ -0,0 +1,203 @@ + + + + + + + image/svg+xml + + + + + + + + + + + + + + + + + Users + + + + + data + bin + tmp + /root + + + + + + + + + larry + + + + + imhotep + nelle + + diff --git a/fig/homedir.odg b/fig/homedir.odg new file mode 100644 index 00000000..f81b366c Binary files /dev/null and b/fig/homedir.odg differ diff --git a/fig/nano-screenshot.png b/fig/nano-screenshot.png new file mode 100644 index 00000000..50fb1710 Binary files /dev/null and b/fig/nano-screenshot.png differ diff --git a/fig/redirects-and-pipes.png b/fig/redirects-and-pipes.png new file mode 100644 index 00000000..3c595a59 Binary files /dev/null and b/fig/redirects-and-pipes.png differ diff --git a/fig/redirects-and-pipes.svg b/fig/redirects-and-pipes.svg new file mode 100644 index 00000000..f6315dc0 --- /dev/null +++ b/fig/redirects-and-pipes.svg @@ -0,0 +1,71 @@ + + + + + background + + + + + + + Layer 1 + + + + wc -l *.pdb + + wc -l *.pdb + + + $ + Output in Shell + + OUT + + + wc -l *.pdb + + Output in File + + OUT + wc -l *.pdb + + wc -l *.pdb + + OUT + + + + $ + Output in Shell + + sort -n + IN + + OUT + + IN + + OUT + head -1 + + lengths + $ + $ + | + sort -n + | + head -1 + wc -l *.pdb + $ + | + sort -n + | + head -1 + wc -l *.pdb + $ + > + lengths + + \ No newline at end of file diff --git a/fig/shell_script_for_loop_flow_chart.svg b/fig/shell_script_for_loop_flow_chart.svg new file mode 100644 index 00000000..4654cf25 --- /dev/null +++ b/fig/shell_script_for_loop_flow_chart.svg @@ -0,0 +1,927 @@ + + + +image/svg+xmlfor filename in *.datdo echo cp $filename original-$filenamedone +Process Flow +Variable value +Process +Stdout +input-1.dat +echo +cp input-1.dat original-input-1.dat +input-2.dat +input-3.dat +echo +echo +cp input-2.dat original-input-2.dat +cp input-3.dat original-input-3.dat +Start +Newvalue? +Yes +No +Run process +End +Phase +Shell script + diff --git a/fig/standard-filesystem-hierarchy.svg b/fig/standard-filesystem-hierarchy.svg new file mode 100644 index 00000000..ba798b04 --- /dev/null +++ b/fig/standard-filesystem-hierarchy.svg @@ -0,0 +1,1534 @@ + + + + + + + + + + + + image/svg+xml + + + + + + + + / "root" + + + + + "essential user command binaries" + bashcatchmodcpdateechogrepgunzipgziphostnamekilllesslnlsmkdirmoremountmvnanoopenpingpspwdrmshsutartouchumountuname + /bin + + + + + /dev + "device filesincl. /dev/null" + + + + + /home + "user homedirectories" + + + + + + /proc + "process & kernelinformation files" + + + + + + /lib + "libraries &kernel modules" + + + + + /mnt + "mount files fortemporary filesystems" + + + + + /usr + "read-only user applicationsupport data & binaries" + + + "standard includefiles for 'C' code" + "obj, bin, libfiles for coding& packages" + + /usr/bin + "most usercommands" + + /usr/include + + /usr/lib + + /usr/local + "local software" + + /usr/local/bin/usr/local/lib/usr/local/man/usr/local/sbin/usr/local/share + /usr/share + "static data sharableaccross all architectures" + + /usr/share/man + "manual pages" + + + + + + + /etc + "configuration files for the system" + crontabcupsfontsfstabhost.confhostnamehostshosts.allowhosts.denyinitinit.dissuemachine-idmtabmtools.confnanorcnetworkspasswdprofileprotocolsresolv.confrpcsecurettyservicesshellstimezone + + + + + + /var + "variable data files" + + + /var/cache + "application cache data" + + + + "data modified asprogrammes run" + /var/lib + + + + "lock files to track resources in use" + /var/lock + + + + /var/log + "log files" + + + /var/spool + "tasks waiting tobe processed" + + /var/spool/cron/var/spool/cups/var/spool/mail + + /var/opt + "variable data for installed packages" + + + /var/tmp + "temporary files saved between reboots" + + + + /sbin + "essential systembinaries" + fdiskfsckgettyhaltifconfiginitmkfsmkswaprebootroute + + + + + /opt + "optional softwareapplications" + + + + /root + "home dir. forthe root user" + + + + diff --git a/fig/x-for-directories.svg b/fig/x-for-directories.svg new file mode 100644 index 00000000..c3729346 --- /dev/null +++ b/fig/x-for-directories.svg @@ -0,0 +1,217 @@ + +image/svg+xml + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + vlad + + + + + + + + + + + + + + mars + + + + + + + + + + + + + + venus + + + + + + + + + + + + + + pluto + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + notes + + + + + + + + + + + + + + + + + + + + notes + + + + + + + + + + + + + + + + + + + + notes + + + + + + + + + + + + r-x + + + + + + r-- + + + + + + --x + + + + + + + + \ No newline at end of file diff --git a/files/final_project/data/Fastas_1.tar.gz b/files/final_project/data/Fastas_1.tar.gz new file mode 100644 index 00000000..6f09a570 Binary files /dev/null and b/files/final_project/data/Fastas_1.tar.gz differ diff --git a/files/final_project/data/Fastas_10.tar.gz b/files/final_project/data/Fastas_10.tar.gz new file mode 100644 index 00000000..067dfb41 Binary files /dev/null and b/files/final_project/data/Fastas_10.tar.gz differ diff --git a/files/final_project/data/Fastas_11.tar.gz b/files/final_project/data/Fastas_11.tar.gz new file mode 100644 index 00000000..0f196775 Binary files /dev/null and b/files/final_project/data/Fastas_11.tar.gz differ diff --git a/files/final_project/data/Fastas_12.tar.gz b/files/final_project/data/Fastas_12.tar.gz new file mode 100644 index 00000000..7749d837 Binary files /dev/null and b/files/final_project/data/Fastas_12.tar.gz differ diff --git a/files/final_project/data/Fastas_13.tar.gz b/files/final_project/data/Fastas_13.tar.gz new file mode 100644 index 00000000..0ff2b634 Binary files /dev/null and b/files/final_project/data/Fastas_13.tar.gz differ diff --git a/files/final_project/data/Fastas_14.tar.gz b/files/final_project/data/Fastas_14.tar.gz new file mode 100644 index 00000000..87b11aec Binary files /dev/null and b/files/final_project/data/Fastas_14.tar.gz differ diff --git a/files/final_project/data/Fastas_15.tar.gz b/files/final_project/data/Fastas_15.tar.gz new file mode 100644 index 00000000..299c6def Binary files /dev/null and b/files/final_project/data/Fastas_15.tar.gz differ diff --git a/files/final_project/data/Fastas_16.tar.gz b/files/final_project/data/Fastas_16.tar.gz new file mode 100644 index 00000000..a8a95b27 Binary files /dev/null and b/files/final_project/data/Fastas_16.tar.gz differ diff --git a/files/final_project/data/Fastas_2.tar.gz b/files/final_project/data/Fastas_2.tar.gz new file mode 100644 index 00000000..b914bc23 Binary files /dev/null and b/files/final_project/data/Fastas_2.tar.gz differ diff --git a/files/final_project/data/Fastas_3.tar.gz b/files/final_project/data/Fastas_3.tar.gz new file mode 100644 index 00000000..9f779484 Binary files /dev/null and b/files/final_project/data/Fastas_3.tar.gz differ diff --git a/files/final_project/data/Fastas_4.tar.gz b/files/final_project/data/Fastas_4.tar.gz new file mode 100644 index 00000000..f19a0360 Binary files /dev/null and b/files/final_project/data/Fastas_4.tar.gz differ diff --git a/files/final_project/data/Fastas_5.tar.gz b/files/final_project/data/Fastas_5.tar.gz new file mode 100644 index 00000000..6667bbcb Binary files /dev/null and b/files/final_project/data/Fastas_5.tar.gz differ diff --git a/files/final_project/data/Fastas_6.tar.gz b/files/final_project/data/Fastas_6.tar.gz new file mode 100644 index 00000000..40894284 Binary files /dev/null and b/files/final_project/data/Fastas_6.tar.gz differ diff --git a/files/final_project/data/Fastas_7.tar.gz b/files/final_project/data/Fastas_7.tar.gz new file mode 100644 index 00000000..2c895c99 Binary files /dev/null and b/files/final_project/data/Fastas_7.tar.gz differ diff --git a/files/final_project/data/Fastas_8.tar.gz b/files/final_project/data/Fastas_8.tar.gz new file mode 100644 index 00000000..5b413ad2 Binary files /dev/null and b/files/final_project/data/Fastas_8.tar.gz differ diff --git a/files/final_project/data/Fastas_9.tar.gz b/files/final_project/data/Fastas_9.tar.gz new file mode 100644 index 00000000..a1601bec Binary files /dev/null and b/files/final_project/data/Fastas_9.tar.gz differ diff --git a/files/final_project/data/readme.md b/files/final_project/data/readme.md new file mode 100644 index 00000000..6fe533bf --- /dev/null +++ b/files/final_project/data/readme.md @@ -0,0 +1 @@ +16 fasta para el proyecto opcional del episodio 10 diff --git a/files/final_project/example/Complete_ID.fasta b/files/final_project/example/Complete_ID.fasta new file mode 100644 index 00000000..d305db63 --- /dev/null +++ b/files/final_project/example/Complete_ID.fasta @@ -0,0 +1,600 @@ +>XP_004844552.1_PREDICTED:_UDP-glucuronic_acid_decarboxylase_1_isoform_X3 +MNFTQKYPPVKFLSEKDRKRILITGGAGFVGSHLTDKLMMDGHEVTVVDNFFTGRKRNVEHWIGHENFELINHDVVEPLYIEVDQIYHLASPASPPNYMYNPIKTLKTNTIGTLNMLGLAKRVGARLLLASTSEVYGDPEVHPQSEDYWGHVNPIGPRACYDEGKRVAETMCYAYMKQEGVEVRVARIFNTFGPRMHMNDGRVVSNFILQALQGEPLTVYGSGSQTRAFQYVSDLVNGLVALMNSNVSSPINLGNPEEHTILEFAQLIKTLVGSGSEIQFLSEAQDDPQKRKPDIKKAKLMLGWEPVVPLEEGLNKAIHYFRKELEYQANNQYIPKPKPARIKKGRMRRAR +>XP_004848039.1_PREDICTED:_heterogeneous_nuclear_ribonucleoprotein_D0_isoform_X1 +MSEEQFGGDGAAATAAVGGSAGEQEGTMAAAAQGAAAAAAGGGAGAGGGAAAGGPEGGSSESEGAKIDASKNEEDEGHSNSSPRHTEAATAQREEWKMFIGGLSWDTTKKDLKDYFSKFGEVVDCTLKLDPITGRSRGFGFVLFKESESVDKVMDQKEHKLNGKVIDPKRAKAMKTKEPVKKIFVGGLSPDTPEEKIREYFGGFGEVESIELPMDNKTNKRRGFCFITFKEEEPVKKIMEKKYHNVGLSKCEIKVAMSKEQYQQQQQWGSRGGFSGRARGRGGGPSQNWNQGYSNYWNQGYGNYGYNSQGYGGYGGYDYTGYNNYYGYGDYSNQQSGYGKVSRRGGHQNSYKPY +>XP_012933162.1_PREDICTED:_C-Jun-amino-terminal_kinase-interacting_protein_4_isoform_X11 +MIHNYMEHLERTKLHQLSGNDQLESTAHSRIRKERPITLGIFPLPAGDGLLTPDTQKGGETPGSEQWKFQDLSQPRSHTSLKVSSSPEPLKAIKQEDELSDVSQGGSKATTPASTANSDVAAIPPDTPLKEESDGLAKGTDSPAKLELSKHIEVQVAQETRNVSTGSAENEDKSEVQAIIESTPELDMDKDLSGFKGSSTPTKGIENKAFDRNTESLFEELSSAGSGLIGDVDEGADLLGEYSDHNFFGMGREVENLILENTQLLETKNALNVVKNDLIAKVDELTCEKDVLQGELEAVKQAKQKLEEKNRELEEELRKARAEAEDARQKAKDDDDSDIPTAQRKRFTRVEMARVLMERNQYKERLMELQEAVRWTEMIRASRENPAMQEKKRSSIWQFFSRLFSSSSSTTKKPEPPVNLKYNAPTSHVTPSVKKRSSTLSQLPGDKSKAFDFLSEETEASLASRREQKREQYRQVKAHVQKEDGRVQAFGWSLPQKYKQVTNGQGENKMKNLPVPVYLRPLDEKDASMKLWCAVGVNLSGGKTRDGGSVVGASVFYKDVAGLDMEGSKQRSASQSSLDKLDQELKEQQKELKTHEELSSQVWICTSTHSATKVIIIDAIQPGNILDSFTVCNSHVLCIASVPGARETDYPAGEELSESGQVDKASLCGSVTSNSSAETDSLLGGITVVGCSTEGATGAAASPSTNGASPVTDRPPEIEAENSEVDENVPTAEEATEATEGNAGSAEDAVDVSQPGVYTEHVFTDPLGVQIPEDLSPVCQSSSDSDVYKDPISSVLPNEQDLVREEAQKMSSLLPTMWLGAQNGCLYVHSSVAQWRKCLHSIKLKDSILSIVHVKGIVLVALADGTLAIFHRGVDGQWDLSNYHLLDLGRPHHSIRCMTVVHDKVWCGYRNKIYVVQPKAMKIEKSFDAHPRKESQVRQLAWVGDGVWVSIRLDSTLRLYHAHTYQHLQDVDIEPYVSKMLGTGKLGFSFVRITALMVSCNRLWVGTGNGVIISIPLTETVILHQGRLLGLRANKTSGAPGNRPGSVIRVYGDENSDKVTPGTFIPYCSMAHAQLCFHGHRDAVKFFVAVPGQVISPQSGSGSTDLTSDKAGPSAQEPGNQAPLKSMLVISGGEGYIDFRMGDEGGESELLGEDLPLEPSVTKAERSHLIVWQVMYGSE +>XP_012925689.1_PREDICTED:_histone_H3-4-like +MARTKQTARKSTGGKAPRKQLATKAARKSAPATGGVKKPHRYRPGTVALREIRRYQKSTELLILDSGIRPELRRQRPPRCGRCHGQITAATSAAEAAVAKAAPGASRFPDKQRCGPPPPSPTAGRVT +>XP_012929308.1_PREDICTED:_negative_elongation_factor_B_isoform_X2 +MFAGLQDLGVANGEDLKETLTNCTEPLKAIEQFQTENGVLLPSLQSALPFLDLHGTPRLEFHQSVFDELRDKLLERVSAIASEGKAEERYKKLEDLLEKSFSLVKMPSLQPVVMCVMKHLPKVPEKKLKLVMADKELYRACAVEVKRQIWQDNQALFGDEVSPLLKQYILEKENSLFSTELSVLHNFFSPSPKTRRQGEVVQKLTQMVGKNVKLYDMVLQFLRTLFLRTRNVHYCTLRAELLMSLHDLDVGDICTVDPCHKFTWCLDACIRERFVDSKRARELQGFLDGVKKGQEQVLGDLSMILCDPFAINTLSLSTIRHLQELVSQETLPRDSPDLLLLLRLLALGQGAWDLIDSQVFKEPKMEVELITKFLPMLMSFVVDDYTFNVDQKLPSEEKAPVTYPNTLPESFTKFLQEQRMACEVGLYYVLHITKQRNKNALLRLLPGLVETFGDLAFSDIFLHLLTGSLALLADEFALEDFCSSLFEGFFLTASPRVAPSKLEALQKALEPTGQTGEAVKELYTQLGEKLEQLDHRKPSPAQATETPTLELPLPSMPAPAGL +>XP_004837061.1_PREDICTED:_alpha-1-antichymotrypsin +MQLSAQGRVETMSLLLALGLLVAGFCPAIFCHPGGPAARETVPEDRDNGMHVDHLRLASSNADFAFSLYKQLALKAQNKNILFSPMSVSTALAFVSLGARNTTLTEILQGLKFNLTETPEAEIHRSFQHVLRTLQRPDDRLQLSIGNALFIHDQLKLLSKFTEDARGLYAAETITTNFQDPTAAERLINDFVKKETQGKISELVQDLGSTTMMVLVNYIFFKAKWKMPFDPRDTFESSFYLNKREEVQVPMMSLEGQHIPYFRDEELSCTVVELPYTGNASALLILPDKGKMRSVEAALLPESLRRWRDSLQPRRIDEFYLPKFSISGDYQLESILPELGIREVFSPEADLSGVTGAQDLQVSQIFHKAVLDVAEKGTEAAAATGIKFILTSGKIDPVILSFNRPFLMAILPTGMDNTLFLGKVTNPKQA +>XP_012923938.1_PREDICTED:_zinc_finger_protein_740_isoform_X1 +MAQASLLACEGLAGVSLVPTAASKKMMLSPITSKQAENGERAGSPDVLRCSSQGHRKESDKSRSRKDDDSLAEASHSKKTVKKVVVVEQNGSFQVKIPKNFICEHCFGAFRSSYHLKRHILIHTGEKPFECDICDMRFIQKYHLERHKRVHSGEKPYQCERCHQCFSRTDRLLRHKRMCQGCQSKTSDGQFSL +>XP_012928573.1_PREDICTED:_HAUS_augmin-like_complex_subunit_3 +MSCGNEFVETLKKIDYPKADTLNGEDFDWLFETVENESFLKWFCGNVSEQNVLSEKELEAFSILQKSGKPILEGVALDEVLKTCATSDLKTPRLDDKELEKLEDEVQMLQKLKNLKIQRRNKCQLMTSSSSHKSLRLSAEHEEATKNLKQSQGILTAMNTKLSNELQALTDRVTKLMMFFRHSDLSQEANPMVFLSQLSLEKYLSQEEQSTAALTLYTKKQFFQGIHEIVESSNEENFQLLDIRTSSLCDNQEILEERRLEMARLQLAYICAQHQLIHLKASNLSMKSSIKWAEENLHSLTSKAIGKENLDAKISDLNSEILKLEEQITHIKDKSLLAVVKENAQLLNMPVVKGDFDLQIAKQDHYTERQELVLNQLIKQKASFELVQLSYEIELRKHCDTYRQFEKLVQELSQNNMMLFQQLAMLKDPSVSQQINPRNTIDSKDYSSQRLYQLLEGENKRKELFMTHGNLEEMAEKLKQDVSLVQDQLTVSAQQHFLFLSKLNNDVDVLCDALYQGRNQLLLSDQDLTEQFHQVESQLNKLNHLLADTLADVKTKRKILTTNKLHQMERELYVHFFKNGNDLKDIVENLENQSKIKADGLKD +>XP_004854880.1_PREDICTED:_E3_ubiquitin-protein_ligase_RNF6 +MNQSGSRSGSGGEETSSQDHNHRENGRRWQQERLLREEAYYQFINELSDEDYRLMRDHNLLGTPGEITSEELQQRLDGVKEQLMSQPDLRNGTNNRGSQVPRESSNEDSLLAWLHTFHLTGNATRSGQTGNQTWRAVNRTNPNSGEFRFSLEIDINNENRGFEIREEDDTGISLSGINRGHTINRQQRSTSPVARRTRSQTSVNFSGDNSNIPRARLSSRRQNSVDRSLSTLRRLRNRTGRAVGIPRTSTSSNNFSSQTSQSGGSELRQREGQRFGAAHIWENGARTNVTVRNTNQRLEPIRLRSTFSSRSRSPIQRQSGTVHNSQRESRPSWQTIRRSARRRGITQVFLEPDREHRGTAYSRFSNSRLVSRITEEGEESNTSSLAAQRHPTITLDLQVRRIRPGEDRDQDSIANRTRSRTGQGENTITVESNSGGFHRTISRLERSGIRTYVSAVTVPLQRISENELVEPSSVALRSMFRQVMTGFGELSSLMEAESESEIQRNGQHLPDLSNLGTVDDSGQHSESSSQHRRAQEDSTEMLGENEITQPQNRSSDSRSSPQMQNSNNFVETRTLPIFRLAHFFLLNESEDDQRCGLTKEQIDNLSTRNYEHSGIDSELGKICSVCISDYVTGNKLRQLPCMHEFHIHCIDRWLSENCTCPICRQPVLGSGLANNG +>XP_004844000.1_PREDICTED:_protein_strawberry_notch_homolog_1_isoform_X1 +MVEPGQDLLLAALSESGISPNDLFDIDGDVGLATPTPTPALQQSVPFGALELGLEAEAAVTVKQETETVPTPALLNVRQQPPSTTTFVLNQINQLPTLGSTIVMTKTPPVTTNRQTITLTKFIQTTANTRPSVSAPAVRNTVTTAPSKDQVQLKDLLKNNSLNELMKLKPPANIVQPVATAATDVSNGTVKKESSNKEVARIWINDMKMRSFSPTMKVPVVKEEDEPEEEDEEEMGHAETYAEYMPIKLKIGLRHPDAVVETSSLSSVTPPDVWYKTSISEETIDSGWLSALQLEAITYAAQQHETFLPNGDRAGFLIGDGAGVGKGRTIAGIIYENYLLSRKRALWFSVSNDLKYDAERDLRDIGAKNILVHSLNKFKYGKISSKHNGSVKKGVIFATYSSLIGESQSGGKYKTRLKQLLHWCGDDFDGVIVFDECHKAKNLCPVGSSKPTKTGLAVLELQNKLPKARVVYASATGASEPRNMAYMNRLGIWGEGTPFREFSDFIQAVERRGVGAMEIVAMDMKLRGMYIARQLSFTGVTFKIEEVLLSQNYVKMYNKAVKLWVIARERFQQAADLIDAEQRMKKSMWGQFWSAHQRFFKYLCIASKVKRVVQLAREEIKNGKCVVIGLQSTGEARTLEALEEGGGELNDFVSTAKGVLQSLIEKHFPAPDRKKLYSLLGIDLTAPSNNSSPRDSPSKENKMKKRKGEEITREAKKARKVGGLAGSSSDDSGSESDASDIEESDYESSKNMSSGDDDDFNPFRDESSEGDEDDPWLIRKDHKKNKDKRKKKSIDPDSIQSALLASGLGSKRPSFSSTPVISPAPNSAPANSNASSNSSLITSQDAVERAQQMKKDLLEKLEKLAEDLPPNTLDELIDELGGPENVAEMTGRKGRVVSNDDGSISYESRSELDVPVEILNITEKQRFMDGDKNIAIISEAASSGISLQADRRAKNQRRRVHMTLELPWSADRAIQQFGRTHRSNQVTAPEYVFLISELAGEQRFASIVAKRLESLGALTHGDRRATESRDLSRFNFDNKYGRNALEIVMKSIVNLDSPMVSPPPDYPGEFFKDVRQGLIGVGLINVEDRSGILTLDKDYNNIGKFLNRILGMEVHQQNALFQYFADTLTAVVQNAKKNGRYDMGILDLGSGDEKVRKSDVKKFLTPGYSTSGHVELYTISVERGMSWEEATKIWAELTGPDDGFYLSLQIRNNKKTAILVKEVNPKKKLFLVYRPNTGKQLKLEIYADLKKKYKKVVSDDAFVHWLDQYNSSADTCTHAYWRGNCKKASLGLVCEIGLRCRTYYVLCGSVLSVWTKVEGVLASVSGTNVKMQIVRLRTEDGQRIVGLIIPANCVSPLVNLLSTSDQSQQLAVQQKQLWQQHHPQSIANLSNA +>XP_012922623.1_PREDICTED:_transmembrane_protein_14A +MDLIGFGYAALVTFGSILRYKRGGGVPSLIAGLFVGFLAAYGAYRVSSDKRDVKLSLFTAFFLATIMGVRFKRSKKIMPAGLVAGLSLLMILRLVLLLL +>XP_012920745.1_PREDICTED:_leucine-rich_repeat-containing_protein_16B_isoform_X7 +MAKASVELTRELQDSIRRCLSQGAVFQQHRVKLETKPKKFEDRVLALTSWRLHLFPLKVPAKVESSFNVLEIRAFNTLGQNQILVETERGMVSLRLPSAESVDQVTRHVSSALSKVCPGPGCLIRRANADTPEGPRDTSPNSETSTSTTHSVCGGFSETYAALCDYNGLHCREEVQWDVDTIYHAEDNREFNLLDFSHLESRDLALMVAALAYNQWFTKLYCKDLRLGSEVLEQVLHTLSKSGSLEELVLDNAGLKTDFVQKLAGVFGENGSCVLHALTLSHNPIEDKGFLSLSQQLLCFPTGLTKLCLAKTAISPRGLQALGQTFGANPAFASSLRYLDLSKNPGLLATDEANALYSFLAQPNALIHLDLSGTDCTVDLLLGALLHGCCSHLTYLNLARNSCTHRKGREAPPAFKQFFSSTYTLSHINLSATRLPLEALRALLQGLSLNSHLSDLHLDLSSCELRSAGAQALQEQLGSVTCVGSLDLSDNGFDSDLLTLVPALGKNKSLKHLFLGKNFNVKAKTLEEILHKLVQLIQEEDCSLQSLSVADSRLKLRTSILINALGSNTCLAKVDLSGNGMEDIGAKMLSKALQINSSLRTILWDRNNTSALGFLDIARALESNHTLRFMSFPVSDISQAYRSAPERTEDVWQKIQWCLVRNNHSQTCPQEQAFRLQQGLVTSSAEQMLQRLCGRVQEEVRALRLCPLEPVQDELLYARDLIKDAKNSRALFPSLYELGHVLANDGPVRQRLESVASEVSKAVDKELQVILESMVSLTQELCPVAMRVAEGHNKMLSNVAERVTVPRNFIRGALLEQAGQDIQNKLDEVKLSVVTYLTNSIVDEILQELYHSHKSLARHLTQLRTLSDPQGGPGQGQDLSSRGRGRNHDHEETTDDELGTNIDTMAIKKQKRCRKIRPVSAFISGSPQDMESQLGSLGIPPGWFSGLGGSQPTASGSWEGLSELPTHGYKLRHQTQGRPRPPRTTPPGPGRPSQVPVPGTRQENGMASCLDEGLEDFFSRKVMDESSSYPRTLRTVRPGLSEPPLPPLQKKRRRGLFHFRRPRSFKGDRGPGSPTTGLLLPPPPPPPPTQESPPSPDPPSLGNNNSSPCWTPEEESSLLPGLAGGRGPSFRRKMGTEGSEAGEGVTTPRTAQQPTVHGVALPGLGRPKGWSFDGKREGTGSDLEDSTQAWQKRRSSDDAGPGAWKPPPPPQSSKPSFSAMRRAEATWHIAEESGPSHSCQSPSPASQDGEEEEGAFFPERTVLARNAKLQDPPLAPRLPKPVAVPRGRRAPQVQGGREEAETGGTAPGISKPRLRLGSQQDQEEPEVQGPPDPGRRTAPLKPKRTRRAQSCDKLEPDRRRPPDPAGSSEPGTD +>XP_012930225.1_PREDICTED:_neurexin-2-beta_isoform_X17 +MFLFTTEWPEKKRFARGGPKAPGQELAVGREEHPMEGPAHLTLNSEVGSLLFSEGGAGRGGASDVHQPTKGKEEFVATFKGNEFFCYDLSHNPIQSSTDEITLAFRTLQRNGLMLHTGKSADYVNLSLKSGAVWLVINLGSGAFEALVEPVNGKFNDNAWHDVRVTRNLRQHAGIGHAMVNKLHYLVTISVDGILTTTGYTQEDYTMLGSDDFFYIGGSPNTADLPGSPVSNNFMGCLKDVVYKNNDFKLELSRLAKEGDPKMKLQGDLSFHCEDVAALDPVTFESPEAFVALPRWSAKRTGSISLDFRTTEPNGLLLFSQGQRPGAGPGSHGSAQRADYFAMELLDGYLYLLLDMGSGGIKLRASSRKVNDGEWCHVDFQRDGRKGSISVNSRSTPFLATGESEILDLESELYLGGLPEGGRVDLPLPPEVWTAALRAGYVGCVRDLFIDGRSRDLRGLAEAQGAVGVAPFCSRETLKQCASAPCHNGGICREGWNRFVCDCIGTGFLGRVCEREATVLSYDGSMYMKIMLPNAMHTEAEDVSLRFMSQRAYGLMMATTSRESADTLRLELDGGQMKLTVNLDCLRVGCAPSAAGKGPETLFAGHKLNDNEWHTVRVVRRGKSLQLSVDNVTVEAGQMAGAHTRLEFHNIETGIMTERRFISVVPSNFIGHLSGLVFNGQPYMDQCKDGDITYCELNARFGLRAIVADPVTFKSRSSYLALATLQAYASMHLFFQFKTTAPDGLLLFNSGNGNDFIVIELVKGYIHYVFDLGNGPSLMKGNSDKPVNDNQWHNVVVSRDPGNVHTLKIDSRTVTQHSNGARNLDLKGELYIGGLSKNMFSNLPKLVASRDGFQGCLASVDLNGRLPDLIADALHRIGQVERGCDGPSTTCTEESCANQGVCLQQWDGFTCDCTMTSYGGPVCNDPGTTYIFGKGGALITYTWPPNDRPSTRMDRLAVGFSTHQRSAVLVRVDSASGLGDYLQLHIDQGTVGVIFNVGTDDITIDEPNAIVSDGKYHVVRFTRSGGNATLQVDSWPVNERYPAGNFDNERLAIARQRIPYRLGRVVDEWLLDKGRQLTIFNSQAAIKIGGRDQGRPFQGQVSGLYYNGLKVLALAAESDPNVRTEGHLRLVGEGPSVLLSAETTATTLLADMATTIMETTTTMATTTTRRGRSPTLRDSTTQNTDDLLVASAECPSDDEDLEECEPSTGGELILPIITEDSLDPPPVATRSPFVPPPPTFYPFLPGVGATQDTLPPPAARRPPPGGPCQAEHDDSDCEEPIEASGFASGEVFDSSLPPTDDEDFYTTFPLVTDRTTLLSPRKPAPRPNLRTDGATGAPGVLLAPSVPAPNLPAGKMNHRDPLQPLLENPPPGPGAPTSFEPRRPPPLRPGVTSAPGFPPLPTANPTGPGERGPPGAVEVIRESSSTTGMVVGIVAAAALCILILLYAMYKYRNRDEGSYQVDQSRNYISNSAQSNGAVVKEKAPAAPKTPSKTKKNKDKEYYV +>XP_012925914.1_PREDICTED:_sulfatase-modifying_factor_2_isoform_X1 +MALSLSPPLPVLCLLSTPWLQLGNAQAADMVWLPGGRFLMGTDAPDARDGEGPVREVTVKPFGIDIFPVTNKDFRKFVREKKYRTEAELFGWSFVFEEFVSSELKNKAAQQMKPVLWWLPVERAFWRQPTGPGSGIRDRLEQPVLHVSWNDAQAYCRWRGRRLPTEEEWEFAARGGLKGQVYPWGNRFQPNRTNLWQGKFPKGDKAEDGFHGVSPVNAFPPQNDYGWEILLIQPRTIWASAVRPARAGPSVSCELGVEPLGTLSFPGHPQHTRILPSLPHYLPPGQEGTLGGVPGVGWRIGWRTGPQGGLGAGRFPLEVKCC +>XP_004847781.1_PREDICTED:_desmoplakin_isoform_X3 +MSCNGGSHPRLNTLGRMTRAESGPDLRDMRFETTSGGGGGTSRTYYSRRCVVNDQNSDGYGQTGTMSRMQNQNTIQELLQNCADCLMRAELIVQPELKYGDGIQLARSRELDECFAQANDQMEVTDSLIREMRHMGQPCDVYQKRLLQLQEQMRALYKAISVPRVRRASSKGGGGYTCQSGSGWDEFTKRLTSECLGWMRQQRAEMDMVAWGVDLASVEQHINSHRSLHNAIGDYRWQLDKIKADLREKSAIYQLEEEYENLLKTSFERMDHLRQLQNIIQATSREIMWINDCEEEELLYDWSDKNTNIAQKQEAFSIRMSQLEVKEKELNKLKQESDQLVLSQHPASDKIEAYMDTLQTQWSWILQITKCIDVHLKENAAYFQFFEEAQSTEAYLKGLQDSIRKKYPCDKNMPLQHLLEQIKELEKEREKILEYKRQVQNLVNKSKKIIQLKPRNPDYRSNKPIILRALCDYKQDQKIVHKGDECILKDNNERSKWYVTGPGGVDMLVPSVGLIIPPPNPLAVDLSCKIEQYYEAILALWNQLYINMKSLVSWHYCMIDIEKIRAMTIAKLKTMRQEDYMKTISDLELHYQEFIRNSQGSEMFGDDDKRKMQSQFTDAQKHYQTLVIQLPGHPQHQTVTKTEITHVGSCQDVNPNKMIETNRENDKQETWLLMELQKVRRQIEHCEGRMTLKNLLLTDQPSTHHITVKINELKSVQNDSQALAEVLNQLKDVLANFRGSEKYCYLQNEVFGLFQKLENINGVTDGYLNSLFTVRALLQAILQTEDMLKVYEARLTEEETVCLDLDKVEAYRCGLKKIKNDLNLKKSLLATMKAELQKAQQIHCQTSQQYPLYDLDLGKFNDKVIQLTDRWQKIDKQIDYRLWDLEKQIKQLRNYRDNYQNFCKWLYDAKRRQDSLESMKFGDSNTVMRFLNEQKNLHNEISGKRDKSEEVQKIAELCANSIKDYELQLASYTSGLETLLNIPIKRTMVQSPSGVILQEAADMHARYIELLTRSGDYYRFLSEMLKSLEDLKLKNTKIEVLEEELRLARDANSENCNKNKFLDQNLQKYQAECSQFKAKLSSLEELKRQAELDGKSAKQNLDKCYAQIKELNEKITRLTYEIEDEKRRRKSVEDRFDQQKSDYDQLQKARQSEKESLGWQKLESEKAVKEKEYEIERLKVLLQEEGARKREYENELAKASNRIHESKSQCTQVVQERESLLVKIRVLEQEKVRLQRLEEELNRLKATLEAEGRVKQRLESEKQQIQNDLNQWKTQYSRKEEAMRKIESDREKSEREKNTLRSEIERLQAEIKRIEERCRQKLEDSSRETQSQLETERSRLQREFDKLKQRPYGSHRETQTEYEWTVDSSKLVFDGLRKKVTAMQLYECQLIDKTTLDKLLKGKKSVEEVASEIQPFLRGAGAIAGASASPKEKYSLVEAKRKKLISPESTVMLLEAQAATGGVIDPHRNEKLTVDNAIARDLIDFDDRQQIYMAEKAITGFDDPFSGKTVSVSEAIKKNLIDRETGMRLLEAQLASGGIVDPVNSVFLPKDVALARGLIDRDLYRSLNDPRDSQKNFVDPFTKKKVSYVQLRERCRIEPHTGLLLLSVQKRSMSFQGIRQPVTVTELVDSGILRPSTVNELESGQISYDEVGERIKDFLQGSSCIAGIYNETTKQKLGIYEAMKIGLVRPGTALELLEAQAATGFIVDPVSNLRLPVEEAYKRGLVGIEFKEKLLSAERAVTGYNDPETGNIISLFQAMNKELIEKGHGIRLLEAQIATGGIIDPKESHRLPVNIAYKRGYFNEELSEILTDPSDDTKGFFDPNTEENLTYLQLKERCIKDEETGLCLLPLKEKKKQVQTSQKNTLRKRRVVIVDPETNKEMSVQEAYKKGLIDYETFKELCEQECEWEEITITGSDGSTRVVLVDRKTGSQYDIQDAIDKGLVDKKFFDQYRSGSLSLTQFADMISLKNGVGSSISMGSGVSDDVFSSSRHESVSKISTISSVRNLTIRSSSLSDPLEESSPIAAIFDTENLEKISVSEAIDRGIVDSITGQRLLEAQACTGGIIHPTTGQKLSLQDAMAQGLIDSDMATRLKPAQKAFIGFEGVKGKKKMSAAEAVKEKWLPYEAGQRFLEFQFLTGGLVDPEVHGRISTEEAIRKGFIDGRAAQRLQDTSSYAKILTCPKTKLKISYKDAMNRSMVEDITGLRLLEAASVSSKGLPSPYNMSSAPGSRSGSRSGSRSGSRSGSRSGSRSGSRRGSFDATGNSSYSYSYSFSSSSIGH +>XP_012933823.1_PREDICTED:_protein_disulfide-isomerase_A3 +MRSHRLELFSVVALLLSTARLAAASDVLELTDDTFESRVSDTGSAGLMLVEFFAPWLGSGRACVAARPQPSWPACSRPQEPEVSRPSGARSEMEPEGSAQGRIIAVDCTANTNTCNKYGVTGYPTLKIFRDGEEAGAYDGPRTADGIVSHLKKQSGPASVPLRTEEEFKKFISDKDASVVGFFRDLFSEAHSEFLKAASNFRDSYRFAHTNVESLVKEYDDNGEGITLFRPSHLANKFEDKTVAYTEQKMTSGKIKKFIQENIFGICPHMTEDNKDLIQGKDLLIAYYDVDYEKNTKGSNYWRNRVMMVAKKFLDAGHKLNFAVASRKTFSHELSDFGLESSTGEIPVVAIRTAKGEKFVMQEEFSRDGKALERFLQDYFDGNLKRYLKSEPIPESNDGPVKVVVAENFDEIVNNENKDVLIEFYAPWCGHCKNLEPKYKELGEKLSKDPNIVIAKMDATANDVPSPYEVRGFPTIYFSPANQKQSPKKYEGGRELSDFISYLQREATNPPIIQEEKPKKKKKAQEDL +>NP_001292035.1_putative_E3_ubiquitin-protein_ligase_SH3RF2 +MDDLTLLDLLECPVCFEKLDVTARVLPCQHTFCKPCLQKIFKAHKELRCPECRTLVFCSIEALPANLLLVRLLESMRSGQRSWRGGSFRRPGMLTSKNSRKSRTSPRSLQANPFRLVPNIRIHMDGVPRAKALCNYRGQNPGDLRFNKGDVILLRRQLDKNWYLGEINGVNGIFPASSVEVIKQLPQPPPLCRALYNFDLRNKDKNDNQDCLTFLKDDIITVISRVDENWAEGKLGDKVGIFPILFVEPNLTARHLLEKNKGHQSFRTKSLSLVSSSPRGETTNTPTLCRGPGSRRKGPGQFSITTALNTLNRMVHSPSGHHMVEISTPVLINSSNPSVITQPMEKADLPTSSAGQVSIYHPAPASPGHSMAMVSLPSSQQHLSANMFVALHSYSAHGPNELDLQKGEGIRVLGKYQDGWLRGISLVTGRVGIFPNNYVIPIFRKASSFPDSQSPGLYTTWTLSTSSASSQGSVSEGDPRQSRPFKSVFVPTAIINPVKSTAGSGALGQGSLRKGRNSMRKNGSLQRPAQSGIPTLVMGSLRRSPTMTARPQQFQFYQPQGVSSSSSSAVVEMGPKPPSTGEPALTFVNRGSETRIHSAASSLLMESKEVPTKSEPPPKPPASAPPSILVKPENSRNGIEKQVKTVRFQNYSPPPTKHHTSHSSSGKPEQSATLKGSQPEAASLSPEMTILFAHRSGCHSGQQTDLRRKSAFGKATTPVSTASAMKTMSPSK +>XP_012923089.1_PREDICTED:_platelet_endothelial_cell_adhesion_molecule_isoform_X1 +MRPVWAQRGMMWLGALLTLLLCSSLESQENSFTINTIHMQSLPDWTVQNGQNLTLQCIVDISTTSHIKPQYQVVFYKDDVLLYNVSSVKNTENFLIPQARVHDSGTYKCTVILNNKKKKTTPEYQLWVKGVPRPRMTLDKKEAIEGGVVTVNCSVPEERAPIHFKVEKFEQDPKIFKLKKEKTSWEQNFVTLEFPIREQDYVLYFTCQASISLGFQIETSETTRSEEMVTVTASFSTPKFQISPPGVITEGDQLHIRCTIQVTHLAHETPEILIQKDKAIVAHSRHSREAVYSVMATVEDNGNYTCKVESSRLSKVSSIVVNITELFPKPMLEFSSTRVDQGEKLDLLCSIPGAPPANFTIEKEGMIVSQGQNFTKITDGRDSGTYGCTAGIGKVVKRSNAVQITVCENISEPRIFHDTKSEIIKGQSIRVSCQSINGTSPITYHLLKGSDVLENITKTSNDPAVFQDNPTKDVEYKCIADNCHSYPEVSSEVLSIKVIAPVYQVKLTILRSAEVESGKEIVLQCSVNEGTGPITYKFYKDKESKPFHQAISNDTHVIWHKTQASKEQEGQYYCMASNKASVTQSSTQSNMLMVKVFLAPWKKGLIAVVIIGVIIATLIVGAKCYVMRKAKAKQMPVEMSRPAAPLLKSNNEKVSEPNIEANSHYGYSDEVGNHAMKPLNESKDSTNSDVEYTEVEVSSVEPHQVLGTKGTDTVYSEIRKADPNFVENRYSRTEVSLDRT +>XP_004836251.1_PREDICTED:_kelch-like_protein_3_isoform_X1 +MRNWPDSLQSRHRRQEPLGWASCPGLECLGRCIGSWKGGTILGALKLPLFLGDGGAGACGGGGASGLLLLAAERAAGSSGIKPSSQPLIQAGDDEKNQRTITVNPAHMGKAFKVMNELRSKQLLCDVMIVAEDVEIEAHRVVLAACSPYFCAMFTGDMSESKAKKIEIKDVDGQTLSKLIDYIYTAEIEVTEENVQVLLPAASLLQLMDVRQNCCDFLQSQLHPTNCLGIRAFADVHTCTDLLQQANAYAEQHFPEVMLGEEFLSLSLDQVCSLISSDKLTVSSEEKVFEAVISWINYEKETRLEHMAKLMEHVRLPLLPRDYLVQTVEEEALIKNNNTCKDFLIEAMKYHLLPLDQRLLIKNPRTKPRTPVSLPKVMIVVGGQAPKAIRSVECYDFEEDRWDQIAELPSRRCRAGVVFMAGHVYAVGGFNGSLRVRTVDVYDGVKDQWTSIASMQERRSTLGAAVLNDLLYAVGGFDGSTGLASVEAYSYKTNEWFFVAPMNTRRSSVGVGVVEGKLYAVGGYDGASRQCLSTVEQYNPATNEWTYVADMSTRRSGAGVGVLSGQLYATGGHDGPLVRKSVEVYDPGTNTWKQVADMNMCRRNAGVCAVNGLLYVVGGDDGSCNLASVEYYNPVTDKWTLLPTNMSTGRSYAGVAVIHKSL +>XP_012922384.1_PREDICTED:_leucine-rich_repeat_flightless-interacting_protein_1_isoform_X9 +MGSQGAGRRRLPQRERLTAEDDALSRIAREAEARLAAKRAARAEAREIRMKELERQQKEIYQVQKKYYGLDTKWGDIEQWMEDSERYSHRSRRLTSASDEDERLSVGSRGSLRSQPEQQYRGPCVWTNGYDGDLYGSQPPNRRSGRVEERPEKDFTEKGSRSMPGLSAATLASLGGSSSRRGSGDTSISIDTEASLREIKELNELKDQIQDVEGKYMQGLKEMKDSLTEVEEKYKKAMVSNAQLDNEKTNFLYQVDTLKDMLLELEEELAEARRQYEEKTKDFEREKHAHRALQFQFAEVKEALRQRDEMLEEIRQLQQKQASYIGEISDLQETIEWKDKKIGALERQKEFFDSIRSERDDLREEIVKLKEEFKKHGITLNSEVATNGETSGTLNNVGHPGPTKLTKEEVNALQPSGDGTLGRTKEVEVNNEIVQNVGTREISQNTEREQHKEDTVKDDEDVEGSRPGENTEGQKPCEDLAYAECEEQIQSQSPESHETPEQVGSQEVPDMPAEGSGASRGHPKYPEDLGSEAPGPMHEQDTCNASDVIGQSENSVGSQDQENQDLKTDMAELHRKPCQGPALGHGPEAERVSGADPGGPGGGRTEKEPANQEAAEPGGAAPHSAEGAREGSVEEEGDAGTGADKPARAEPQPVPGAPTADSSQEEAPGPGREHTGPEPNERKRDRQAEASESSQKKPKNKKKKTKKKKSPVPAESLEDVGKELAYKDADRGEVEGGQGHLAAEAQEEVAEGGTQRIAAGSGEQGDCAESGEDGNEDDCAKTEGGTEGAAGDTVDLAGRTFQPPGTEAIERELGEGDTDGGTETTGVGVAAEPESPDGTSSSSLQNESLSVAMEDPCRTGSPERHLTALEATGSVGLEEGEPGDLGSETGGHAGGGSGQSKGKEDCTMS +>XP_004854439.1_PREDICTED:_actin-binding_LIM_protein_3_isoform_X3 +MNTSIPYQQNPYSPRGSSNVIQCYRCGDTCKGEVVRVHNNHFHIRCFTCQVCGCGLAQSGFFFKNQEYICTQDYQQLYGTRCDSCRDFITGEVISALGRTYHPKCFVCSLCRKPFPIGDKVTFSGKECVCQTCSQSMTSTKPIKIRGPSHCAGCKEEIKHGQSLLALDKQWHVSCFKCQTCSVILTGEYISKDGVPYCESDYHSQFGIKCETCDRYISGRVLEAGGKHYHPTCARCVRCHQMFTEGEEMYLTGSEVWHPICKQAARAEKKLKHRRTSETSISPPGSSIGSPNRVICAKVDNEILNYKDLAALPKVKSIYEVQRPDLISYEPHSRYTSDEMLERCSYGESLGTLSPYSQDIYENLDLRQRRASSPGYIDSPTYSRQGMSPTFSRSPHHYYRSAGESNIYRKPPIYKRHGDLSTATKSKTSEDISQASKYSPAYSPDPYYAAESEYWTYHGSPKAPRARRFSSGGEEDDFDRSMHKLQSGIGRLILKEEMKARSSSYADPWTPPRSSTSSREALHTAGYDMSLNGSPRSHYLADSDPLISKSASLPAYRRNGLHRTPSADLFHYDSMNAVNWGMREYKIYPYELLLVTTRGRNRLPKDVDRTRLERHLSQEEFYQVFGMTISEFERLALWKRNELKKQARLF +>XP_004842843.1_PREDICTED:_estradiol_17-beta-dehydrogenase_2_isoform_X1 +MIMVISEAAWFCLAVTAALGSIVFCKHKSPGQLGRPVVWLTGLCGGAYLLILSFFWSLVLFSLLCFLMCMYLADQELLPVDQKAVLVTGCDSGFGHALAKNLDKLGFTVFAGVLNEKSSGAEELRRNCSKHITVLQMDITNPEQIKDAHSKVIEKVQDKGLWALVNNAGILGFPTDGELIPMIEYKKCMEVNFFGPVEVTKAFLPLLRKSKGRLVNVSSMGGVVPLPKFAAYNSTKAALTMFSSIMRQELSAWGVKVSVVQPGGFRTNIAGTNDVWLKNEKDILDHLTQEQLRDYGRDYVLLQKNFLNKFESFTCPDFTPVLRDIQHAISAQSPSPFYMPGKMVSLWVYFAFLSPTHLFDYCVKKIFVKSEYIPRALHMPN +>XP_004843004.1_PREDICTED:_60S_ribosome_subunit_biogenesis_protein_NIP7_homolog_isoform_X1 +MRPLTEEETRVMFEKIAKYIGENLQLLVDRPDGTYCFRLHNDRVYYVSEKMLKLAANISRDKLVSLGTCFGKFTKTHKFRLHITALDYLAPYAKYKVWIKPGAEQSFLYGNHVLKSGLGRITESTSQYQGVVVYSMADIPLGFGVAAKSTQDCRKVDPMAIVVFHQADVGEYIRHEETLT +>XP_012928987.1_PREDICTED:_sperm_flagellar_protein_2 +MSESLCQWLNQELKVSRTVNPKSFAKAFSSGYLIGEVLHKFELQDDFSEFSDSRISTARLNNFSRLEPTLHLLSVQFDKNMVQSIITEKPGAATKLLYQLYIALQKKKKSGLTGVQIPTTQPLASLKFQNMKSEASREQRLNRRRQNEIMAKIQAAIIQIPKPASNRTLKALEAQKMMKKQQEAADVADEIMKFEALIEKDLQAKESAFRTGLDTADHTTTDLLNTYSDDDYIKKIQKRLEEDAFAREQREKRRRRLLMDQLIAHEAQEEAYREEQLIHRLMRQSQQERRIAVQLMHVRHEKEVLRQNRIFREKQYEERRLKDFQDALDREAALAKQAKIDFEEQILREKEVHEKIAVERVQARYTKHYKICGEILDQILDLSTKVADYRMLTNNLIPLKMMRDWKELFFHGKPIYEQTSIKHMPANPSEEQLRELDKRDLLDSKDYEEYKNMVGEWTVPEEMVDNLPPSNNSILGHVLHRLIEKSLPPQAEPTEPEMPSFAIKGCVLGKTLSGKTITLNTLQREFPIQVLCVDTLVQEAIQAFYDNEEVSGDLPIQKEGGKSPSDLQKDSKESQDSHNVSSDAPVSGESLPETEGETRSTHTNRTPKPEEVKSSDSNNFSKLTVRAQLGAKSQQLLKKGKSIPDTLLVNIIVNAVNEIPVNQGWILDGFPMTLNQTQLLEEALIGCNRSLIEMETKKTQISTLAVDPMSSKEVPLPSSAFDFVILLDISDSFLLSRMNDIIAEEFSHEMAHKDIGQHGTAENQDKHGYQNLRDHIQNRIIGFLDNWPLLEQWFSEPENILIKINAEIDKEPLFQKLKEIFATEIVKKRNKVEKKLEEKEAEKKAIASLAESLPLPPPPPEPEKEKEIQAQHKQEPSKTPPAKGKPQSETPHDKQEPLHEGKGKKGSHKGKTPGGKTPIKKSPAQSTEVSPTPVGPPPPKPGSEEWVYVSEPVPEEVPSFLVPYWQLIENSYINTIKTALRHLREDQHSVLAYLYEIRTSFQELLRAPDYKQEFVSQWQADFNSLPDDLWDDEETKAELHQRLNDLRERLWDICDARKERAEQERLDIIKERWFQDSLRITTTHFSSLMQAELNCFQDTKRFLQDYYRAMECKSPIEDNKKFTRVTLVQMDAKDVSETQLRFPPSVPRISISPETAMPKPKVKAIMKNKIDSSLENIVSNFEANENLVMDTWQQASSAVSHMVAAEIHQRLMEEEKGNQPADSKEKSPQMGANKKVKKEKEATKKKEADKKAKDKSPPIEEATSVIVTAEEMAKIERKNELSLKIKEEHIAALQFEEKATQFRLELIKAKALTVLEDAVIQVIDVYKIMEKWLGERYLNEMASIEKLTEVARYHIETATKIQKELYLGQEDFFINDDIKVFPDPPPPTRPLPVEKEENGTLTIEQLGNLGDQFLDIAPKGLVRNKTFTDILLDLITLNLGTNSLPSSWMHLSQSELQELTSLLVVNSEFVDCWKFLLVAAMPWPIPLEEELLETLQRFKAVDEAQTGNINFEQYMQAGLWFSGDEEMKIPENPLEPLPFNRQEHLIEFFFMLFADCEKDPPQLDYTQMLLYFACHPDMVEGIYRALSVAVGTHIFRRLKTPLLAAGKTSFSPGMSPIEEFPKLEDKDGREERELKEESDEGEQKEKEKANTEKISMETLLTVFRGGNEAQDTNRFVSHLKIENIYAENFTKTFQDLGVKNMELIEIALLLKHPFIQELIANYLDYKIPVIKKILQRNGHGQRSDEERSPSRFTEEKK +>XP_012924274.1_PREDICTED:_extracellular_calcium-sensing_receptor +MSCSKRESSQGPQITITIESLSWREGRIMASYSCCLVLLALAWHSSAYGPDQRAQKKGDIILGGLFPIHFGVAAKDQDLKSRPESVECIRYNFRGFRWLQAMIFAIEEINSSPALLPNMTLGYRIFDTCNTVSKALEATLSFVAQNKIDSLNLDEFCNCSEHIPSTIAVVGATGSGVSTAVANLLGLFYIPQVSYASSSRLLSNKNQFKSFLRTIPNDEHQATAMADIIEYFRWNWVGTIAADDDYGRPGIEKFREEAEERDICIDFSELISQYSEEDEIQQVVEVIQNSKAKVIVVFSSGPDLEPLIKEIVRRNITGKIWLASEAWASSSLIAMPEYFHVVGGTIGFALKAGKIPGFREFLQKVHPRKSVHNGFVKEFWEETFNCHLQEGAKGPLPMDTFLRGHEEGNSKLSNSSTAFRPLCTGEENISSVETPYMDYTHLRISYNVYLAVYSIAHALQDIYTCLPGRGLFTNGSCADIKKVEAWQVLKHLRHLNFTNNIGEQVTFDEYGDLVGNYSIINWHLSPEDGSIMFKEIGNYNVSANKGVRLFINEEKILWSGFSREVPFSNCSRDCLAGTRKGIIEGEPTCCFECVECPDGEYSDETDASACDKCPDDFWSNENHTSCIAKEIEFLAWTEPFGIALTLFAVLGIFLTAFVLGVFIKFRNTPIVKATNRELSYLLLFSLLCCFSSSLFFIGEPQDWTCRLRQPAFGISFVLCISCILVKTNRVLLVFEAKIPTSFHRKWWGLNLQFLLVFLCTFMQIVICVIWLYTAPPSSYRNHELEDEIIFITCHEGSLMALGFLIGYTCLLAAICFFFAFKSRKLPENFNEAKFITFSMLIFFIVWISFIPAYASTYGKFVSAVEVIAILAASFGLLACIFFNKVYIILFKPSRNTIEEVRCSTAAHAFKVAARATLRRSNVSRKRSSSLGGSTGSIPSSSISSKSNSEDPFPQAERQKQQRPLALTGQEQQQQPVTLQPQQPQQSQPQPRCKQKVIFGSGTVTFSLSFDEPQKNAMAHRNTTHQNSLETQKSNDGLSRHQALLPLQYRDTDSGLTTQETGQQGMVAGDHQPELEDPEEMSPALVMSKSRSFVISGGGSTVTENILHS +>XP_004840002.1_PREDICTED:_up-regulator_of_cell_proliferation_isoform_X2 +MEGDDCGFHYGDGTNEAQDNDFPTVERSRLQEMLSLLGLEAYQAQKLSLQDSLQISFDSMKNWAPQVPKDLPWHFLRKLQALNAEARNTTMVLDMPADARPAEKESQMEEEMIYWDPAEDIAADDIYSFSELPTPDMPVNPLDLLCALLLSSDSFLQQEIVLKMSLCQFALPLVLPDSENHYHTFLLWALRGVVWTWWSQTPRGLGSFREDSVVLSRVPTFAFVRMDVSSNSKSQLLNAILSLGRRQWDCFWHRDLSLGTNPREIADGLVEISWFFPSGRDDLDIFPEPVAFLNLRGDIGSHWLQFKLLTEISSAVFILTDNISKKEYKLLYSMKESTTKYYFILSPYRGKRNTNLRFLNRLTPVLKIDHSHVLVKVSSTDSEGFVRRLRAIVASVVRAPCRRVSVEDMAHAARKLGLRVDEDFEECQKAKDRMERITRKIKDVDAYRRDELRLQGDLGRKVAQVEREFCQLQWAPEPPEKHRVELRRRLLELRAQQSGQEPSMGLQDFIVGISSPSEGERQYFLRWMEWGLARVGHPRLRQPPETLLALRPKLGGASDFSEPLWPEPLGIEHFLREMGQFYESESCLVEAGRLPAGQRRFAHFPGLATELLLAGLPLELVDGGTLSIPIHWVTGLLKELHIRLDRRSRLVVLSTLGVPGTGKSTLLNTMFGLRFATGRSCRPRGAFMQLITVAEGFSQDLGCDHILAIDSGALISGALVSAGDRFELEASLATLLMGLSNVTVVSLAETRDIPPAILHAFLRLEKRGHMPNCQFVYQSLHDVPAPSPKPRERRQLLDPPGDLGRAAQVEKQSGSFRTLAGLAFCDPERQHVWHVPGLWHGAPPMAAVSLGYSEAIFELKRCLLENIRNGLSNQNKNIQQLIELVRRL +>XP_004852209.1_PREDICTED:_liprin-alpha-1_isoform_X2 +MMCEVMPTISEAEGPPGGSGSHGSGSPSQPDADSHFEQLMVSMLEERDRLLDTLRETQETLALTQGKLHEVGHERDSLQRQLNTALPQEFAALTKELNVCREQLLEREEEIAELKAERNNTRLLLEHLECLVSRHERSLRMTVVKRQAQSPAGVSSEVEVLKALKSLFEHHKALDEKVRERLRVALERCSLLEEELGATHKELMILKEQNNQKKTLTDGTLDVNHEQENTPSTNGKRSSDGSLSHEEDLAKVIELQEVIDKQSREQSQMKERLAALSSHVSELEEDLDTARKDLIKSEEMNTKLQREVREAMAQKEDMEERITTLEKRYLAAQREATSVHDLNDKLENEIANKDSIHRQTEDKNRQLQERLELAEQKLQQTLRKAESLPEVEAELAQRVAALSKSDPLPTGSSAVKEAKLFELTSKLRKAEERHGNIEERLRQMEAQLEEKNQELQRARQREKMNEEHNKRLSDTVDKLLSESNERLQLHLKERMAALEDKNSLLREVENAKKQLEETQHDKEQLVLNIEALRAELDQMRLRGASLHLGRPHLGSVPDFRLPMADGHTDAYSTSAVLRRPQKGRLAALRDEPSKVQTLNEQDWERAQQASVLANVAQAFESDVDVSDGEDDRDTLLSSVDLLSPSGQADAQTLAMMLQEQLDAINKEIRLIQEEKENTEQRAEEIESRVGSGSLDNLGRFRSMSSIPPFPASSLAGSSPPGSGRSTPRRVPHSPAREVDRLGVMTLSPASREEVRDDKTTIKCETSPPSSPRSLRLDRLHKGALHTVSHEDIRDMRNSTGSQDGPVSNPSSSNSSQDSLHKAPKKKGIKSSIGRLFGKKEKGRPGQTGKESPGQAGVSETENSSQDALGLSKLGGQAEKNRKLQKKHELLEEARRQGLPFAQWDGPTVVVWLELWVGMPAWYVAACRANVKSGAIMSALSDTEIQREIGISNPLHRLKLRLAIQEIMSLTSPSAPPTSRTTTGNVWLTHEEMETLAATPQTEDEEGSWAQTLAYGDMNHEWIGNEWLPSLGLPQYRSYFMECLVDARMLDHLTKKDLRGQLKMVDSFHRNSFQCGIMCLRRLNYDRKELERKREESQNEIKDVLVWSNDRVIRWILSIGLKEYANNLIESGVHGALLALDETFDFNALALLLQIPTQNTQARAVLEREFNNLLVMGTDRRFDEDDDKSFRRAPSWRKKFRPKDIRGLAAGSAETLPANFRVTSSMSSPSMQPKKMQMDEAETSFSLLREVVLATAPAAVPLHLRPTPESSSVSGTQRLDSATVRTYSC +>XP_012923746.1_PREDICTED:_probable_phospholipid-transporting_ATPase_VA +MECAGPWRRHGDSGARTVRSGLLPGAPALGLRAPPAADNRLRTTKYSLLSFVPKNLFEQLHRLANVYFVLIALLNFAPPVSAFQPGLALAPVLFILAVTALKDLWEDLSRHRSDRAINHRACLVFGREEKTYVSRFWKEICVGDFVRLRCNEIIPADILLLSSSDPDGLCHIETANLDGETNLKRRQVVHGFSELVSEFNPLTFTSVIECEKPNNDLSRFRGCIMHGGGEKAGLRKENLLLRGCTIRNTEAVVGIVIYAGHETKALLNNSGPRYKRSQLERQMNSDVLWCVLLLICMSLFSAIGHGLWVRRYQEKKALFDVPESDGSSLSPVTAAVYSFLTMIIVLQVLIPISLYVSIEIVKVCQVYFINQDIDLYDEEMDSRLQCRALNITEDLGQIQYIFSDKTGTLTENKMVFRRCTVSGVEYSHDANAQRLARYQEADSEEEEMLPKRASWPQHSSIGSCQSVRIVHRTQSTKSHWRSGGRAEAKRASELSRHTAFSSPMEKDITPDPKLLEKVSECAKCLAVARHQEQPLARLSAELADVFDFFLALTICNTVVVTSADQPRQKQVRVRFELKSPVKTLEDFLRRLTPSRLASTCSSTGSLATAKTSPKSGSGFLSSLSSDSMFLKLEERRGQSAPSIASNGYSSPAESWALEQKPEAGHEGELHYEAESPDEAALVYAARAYRCALVDRLPDQVSVELPHLGRLTFQLLHTLGFDSTRKRMSVVIRHPLTDEINVYTKGADSSVMDLLLPCSSEDARGRHQKRIRSKTQSFLNLYAVEGLRTLCIAKRVLSKEEYACWLQGHLEAESSLDNREELLFQSALRLETNLHLLGATGIEDRLQAGVPETISKLRQAGLQIWVLTGDKQETAVNIAHACKLLDHDEEIITLNAESQEACAALLEQCLQYAQSRGPCSTPEKTQGDISMGPFALCSASKPAASGPSLSLVIDGRSLAYALEKNLEDKFLFLAKQCRSVLCCRSTPLQKSMVVKLVRSKLKAMTLAIGDGANDVSMIQVADVGVGISGQEGMQAVMASDFAVPKFRYLERLLIVHGHWCYSRLANMVLYFFYKNTMFVGLLFWFQFYCGFSASAMIDQWYLIFFNLLFSSLPQLVTGVLDKDVPADVLLTEPQLYKSGQEMEEYRPRAFWLNMVDAAFQSLICFFIPYLAHYDSDVDISTWGTPITVTALLTFLLHLGVETKTWTWLNWMACGFSVLLFLSVALIYNSACSTCYPPSNPYWTMQTLLGDPVFYLICLITPVTALLPRLFVRALQGSLFPTQLQLGHQLAKKCRETLKTPRETFAQGHLPGEPQTELSPRSTSNESLAPDCASQASRHTQQLPACSPEARGEPSAVDTSVPRRENSLLGSPGSSTPGEAVSGECPGHLQRTPLSTGQASPLSLFSSLGWVSSLVPVSGLGSVLRFSRSSLHVDKRDSGFLPSPPQPEQDLCGSQRPAANF +>XP_012929377.1_PREDICTED:_tetratricopeptide_repeat_protein_21A_isoform_X5 +MCSSDSSLLAGIIYYSQEKYFRHVQQAAAVGLQKFSNDPVLQFFKSYGVLREERVQDAISELENIRGHPDLSLCSVMALLYAHKCCEIVDREAIQELETSLKEVREQASETALYYAGLFLWLIGRHDKAREYVDHMLNASSSFRELHPQGYVLKGWVDLTSEKPHIVKKSIKYLEQGMQSNKDVLGLMGKATYLMIQQNYSGALDVVNQISTASGSFLPALVLKMRLFLAQQDWEQTMETTHRILEKDESNIDACQILTVHELVREGNMTTATDNVRNLIKALEMREPQNPSLQLKKILVISRLCGRHRAILRLVSSFMERIFLAMPSCAQVATELGYLFILQNQEKEAALWYSEAMKLGENSVAALTGTIWCHILKDELEEAEHQLEFLKEVQQSLGRSEVLVFLQALLASKKHKGEQEVTALLQEVVELHFSHLQGLPLSPEYLEKLDPPFLVCIAKEYLQFCPKQPRAPGQLVSPLLKQAAVILSPVVRAAPALPDPLYVMGQVKYLSGELENAQSTIQRCLELDPTSADAHLLLAQIYLAQGNFAMCSHCLELGVSHNFQVRDHPLYHFIKARALSKSGDYQEAIKTLKMIMKLPTLKTEESRKIRGPSVQPSERVSILLELVDALRLNGELHEATKVMQDTINEFSGTAEEIRITIANVDLALSKGNMDLALSMLRNITPKQPCYTEAKEKMASIYLHSRKDTCLYIGCYRELCEHLPGPHTSLLLGDAFMNIQEPEKALEVYNEAYKKNPHDASLVSRIGQAYVKTHQYSKAINYYEAAQKISGLDFLCCDLAELLLKLKKFNKAEKVLKQALGHDVVKDIPSMMNDVKCLLLLAKVYKSYKKEEVLETLNKALNLQSRILKRVPLEQPEMLPSQKQLAASICMLFGEFYSAEKDYAKAVQSYRDALSYSPTDNKVVLELAHLSLLQGYLDLSEQHCVILLQTDQAHETASLMMADLMFRKQNYEAAINLYHQVLEKAPDNFSVLDKLIDLLRRSGKLDEAPAFFQLVKKMSSRVSMEPGFNYCRGIYCWHIGQPNQALKFLNKARKDITWGQRANYYMVHICLNPDNEIMGGEAFENQLTNTKKESEQQGVRTAEKLLRDFYPLSVIGQTQQRLLQSLCLLATREKANMEAALGAFLEIAQAEKDSIPALLGVSQACMLLKQVPKARTQLKRLAKVPWTLVEAEDLERSWLLLADIYSSGGKFDLASELLRRCIQYNKSCYKAYEYMGFIMEKEQSYKDAATNYELAWKYSHQANPAIGKAASKVPVSRCGREAGTGPHSDSRTQGLYPGSWGNQRGSHLLRMPPSVISLFPGQVSDLLSTI +>XP_004856054.1_PREDICTED:_general_transcription_factor_3C_polypeptide_1_isoform_X2 +MDALESLLDEVALEGLDGLCLPALWSRLESRVPPFPLLLEPYTQEFLWRALATHPGISFYEEPRERPDLQLQDRYEEIDLETGILESRRDPVSLEDVYPIHMILENKDGIQGSCQFFKERKNITSNIRSKSLQPRCTMMEAFDRWGKKLIIVASQDMRYRALIGAEGDPDLKLPDFSYCILERLGRSRWQGELQRDLHTTAFKVDAGKLHYHRKILNKNGLITMQSHVIRLPTGAQQHSILLLLNRFHVDRRSKYDILMEKLSGMLSTRSNRIETLGRLREELGLCERTFKRLYQYMLNAGLAKVITLPLQEIHPECGPCKTKKGTDVMVRCLKLLKEFKKKVEDDHDDDDDEEVISKAVLPVDIVYERDMLTQTYDLIERRGTKGISQAEIRVAMNVGKLEARMLCRLLQRFKVVKGFMEDEGRQRTTKYISCVFAEESDLSRQYAREKARGELLTTVSLASMSEEPLLPEGEDAFLSESDSEEEGSRVSKRRARGAQPHVRPSAEFGPGAQPQHSTPTKGGWKLLNLHPLKRQLPSSPGAAEERASRSSGARDNLDTSGSSDFNVSFGSHCMESASGDIAMIEEVRLDNPKESGSSQKAGKHSTGLEKPHKTYRLLKRRNLIIEAVTNLRLIESLFTIQKMIMDQEKQEGVSTKCCKKSIVRLVRNLSEEGLLRLYRTTVIQDGIKKKVDLVVHPSMDQNDPLVRSAIEQVRFRISNSTTANRGKVPQPPAPPEEVEEESQGQEEPSRSGDCDMNASSKPESGRGKKTDEKMGVTPMKNYHPVVVPGLGRSLGFLPKMPRLRVVHTFLWYLIYGHPACYVMEKPVLFGSERRGGRHPRGDWDASDLRDNPDGVTWETEVELSTETVYVDDASWMRFIPPIPVHRDFGFGWALVSDILLSLPLSIFVQIVQVSYKVDNLEEYLNHPLKQHTLIRFLPRPIRQQLLYKRRYIFSVMESLQRLCYMGLLQFGPTEKFQDKDQVFVFLKKKAVIIDTTICDPHYNLAHSSRPFERRLYVLNSMQDVESYWFDLQCVCLNTPLGVVRCPAVPKNSADHASDEEGSLRKEQEKAVDKHNLERKCAMQEYTTGSREIMDEGHIPGDGLGAAGLDSSFYAHLKRNWIWTSYIINKARKENITAENGLTVRLQTFLSKRPLPLGAAGSSRLPLWGEAKAGSELSAHREQFGMEREPTLGRSRRVKGGRNQKRKRLRKDPVRRTKRRRKEELPGAKIKRPRYHDEADQSALRRMTRLRVSWSTQEDGLLVLCRIASNVLNSKVKGPFVPWQVVRDILHATFEESLDKTSHSVGRRARYIVRNPQAYMNYKVCLAEVYQDKALVGDFMNRKCDYEDPKVCAKEFKEFVEKLKEKFSSALRNPNLDIPDTMQELFARYRVLAIGDEKYRTRKEDELSSVEDIQFLVLQNLIQSTLSLSNSQVKSCQSFQMFRLYREYKEPVLVRAFMECQKRSLVNRRRVSHTTGPKKNRALPFVPMSYQLSQSYYRLFNWRFPSTICTESFQFFDSLRAAGRLDQSDPFCFKDQDNSEPPAGMVAFSLDGPGGHCATALTLWSLGLVSVDVRIPEHILVVDSAIMKSLGKDGALEDEEDEEEDLDEGTGAKRAGVEVKAHQASHTKYLLMRGCCVPGLISTRNLNPNDSVVVNSCQVKFRLRCSPLDTQLKPADPSLQELTEGTSCLPNSFTRLMEPPGNMVSREEFARHGVLSGYSPEDLSAAQEIWQAVVSAGCFGIDKEKLSSQFLALENTAGSKTFQDYIQDLLAWSQVLEVGSNTVRLVAMAFARPWLLHSVRLKDTEEDAPATLPEGPASERLAPPSQSTKRRPRWASQSSDTDADTDAEYTRKPPAKRLMLQHVHWAPGPRLAAEEGVETLAWAPPLALEDPGAGGTGQEDQERGLPSSLGPEPLSTQAQLPEGSEDPRGLLDATGAGGLSQAPPEKDCEDICFIGRPWRGVDGLLNMPVCKGMMEALLYHVMSKPGVPESSLLQHYQGVLQPVAVLDLLQGLESLGCIRKRVLRKSPTVSLFSEPGVAGPGPEVPLGLSGSTEAFYEPTLDCTIRLGRIFPPKVNWNKWIHL +>XP_012923428.1_PREDICTED:_GON-4-like_protein_isoform_X4 +MLPCKKRRTTVTENSQDKSSQEEDNLDQESAVKPESDLLKDLGSVSLSWGPSHGRTVGFEVQSVQNVGNQPGVEAPLLSSRILTQDTNLPSLEAVDEAISQEITLTSLESSHSPNVHIGKGKLQATASKRGKKVVIRPGLVTQEDRGDLPIMKKPFAGEPGEEVKEEGEEQSSEENEKRRKKKKGTKRKRDGRGQEQGALACDLKLDDVLDRTLEDGAKQHNLTAVNVRNILHEVITNEHVVAMMKAAISETEDMPMFEPKMTRSKLKEVVEKGVVIPTWNISPIKKANEIKPPQFVDIHLEEDDSSDEEYQPGEEDEDETAEESLLESDVESTASSPRGAKKSRLKQSSEIAETDEESGVLLEAEKVTTPAIRHISAEVVPMGPPPPPKPKQTKDSTFMEKLHAVDEELASSPVCMDSFQPLDDSLIAFRTRSKMPLKDVPLGQLEAELRAPDITPDMYDPNTADDEDWKVWLGGLMNDDVGNEDEADDDDDPEYNFLEDLDEPDTEDFRTDRAVRITKKEVNELMEELFETFQDEMGFSNMEDDGPEEEERVAESRPNFNTPQALRFEEPLANLLNEQHRAVKELLEQLKMKKSSARQQQEVEKLKPQAEKVHQTLILDEVQRKRLQEQMQQHVQLLTQIHLLASSNPNLSSEASTTKIFLKELGTFAQSSTALHHQSNPTFQTLFQPCNLMGAMQLIEDFSTHVSVDWIPPKTMRKNGHEFFCLPKQVAWILATSKVFMYPELLPLCSLKAKNPQDKLIFTKAEDNLLALGLKHFEGTEFPKPLISKYLLTCKTAHQLTVRIKNLNLSRAPDNVVKFYKKTKQLPVLSKCCEEVQPHERKPPLEREEHRLPFWLKASLPSIQEELRLGAHDGRAVGNGTGTTEVSADRGLEKARSEPGSETRYPLLLPKGVVLKLKPVANRFSRKTWRQKRSSVPPSKMVVRVPQLIQPAAVLQPAPGVPPLGLSGDNSFESPAALSTVPPEARTSFLLSESQALPPSAPVPKVMLPSLGPRFRKPCVRRKPSRRKGAKVFPCPKPAPLIHSAPVIFTVPATTVKVVSLGSGCNVIQPVSAAVARSPQTIPITTLLVNPASFPCPLSQPLVASSISPLIVSGNSVNLPVSSTPEDKARVNVDISCPLAEGKNAFQSLEPKLEPQEVTPLCAPVFPKEEYGPRPLLAGREGREGQVGLSANSACGWTVVSKEEGRQGLEPLPQGFHGIRNSSPADLKEAVKMEPEDPGEAISSGPPEQRIGDEIKKERFVEWDSGSPREGLSSARVLKKQAVLQEEEDRSQPAQTPSASWEPPGEGSAVGDGSSAPSSVEPEMALSSAPGKPEEASGVGGPSAGGPAGPEVGGEKDGPEEEEEEDFDDLTQDEEDEMSSASEESVLSVPELQETMEKLTWLASERRMSQEGESEEENSQEENSEPEEEEEEEAEGVESLQKEDEMVDDTGGDTAEKPPSTLASPTTAPEVETCRIPAGENIKAAGKGRSSHRARTKRGSRARASKDASKLLLLYDEDILERDPLREQKDLAFAQAYLTRVREALQHIPGKYEDFLQVIYEFESSSQRQTAVDLYKSLQILLRDWPQLLKDFAAFLLPEQALACGLFEEQQAFEKSRKFLRQLEICFAENPSHHQKIIKVLQGCADCVPHEITELKTQMWQLLKGHDHLQDEFSIFFDHLRPAASRMGDFEEISWTEEKEYEFDGFEEVALPDVEEEEEAPKIPTASKNKRRKEAGAQNHDKETEWPDGAKDCACSCHEGGPDSKLKKSKRRNCSHCSGTKVCDSKPYKHKEPPESVSSSPHGEASPGRSAKEAGPGKELGEEEALEDPESTDAPQSRAGRAARKGEAPIPGSAVRSLLLSPQEVPLTDHLPEGPPAPPETPQCPPPTAAELDAVQRSQAGPEGPSASACARPEEGASRKAAGDSEAASRGWDALQPEPLLGTVETPAPSLSPASSRTRVIGRRLTPGKPDPQDSWLPSSRAGARRANRTSPGHEPSTGMDTSETAPEAPKRSLAKDGGVQGRGLEGEQQLKATEATVCANNSKGSGPSDPHHVSGTGSAAADLQQHLSAAGKQDPSRGLPPLPRTHAALPHGL +>XP_012922795.1_PREDICTED:_protein_numb_homolog_isoform_X1 +MNKLRQSFRRKKDVYVPEASRPHQWQTDEEGVRTGKCSFPVKYLGHVEVDESRGMHICEEAVKRLKAERKFFKGFFGKTGKKAVKAVLWVSADGLRVVDEKTKDLIVDQTIEKVSFCAPDRNFDRAFSYICRDGTTRRWICHCFMAVKDTGERLSHAVGCAFAACLERKQKREKECGVTATFDASRTTFTREGSFRVTTATEQAEREEIMKQMQDAKKAETDKTASASSVASGNTAPSPSSPTSPTSDTTASLEMNNPHAIPRRHAPIEQLARQGSFRGFPALSQKMSPFKRQLSLRINELPSTMQRKTDFPIKNAVPEVEGEAESISSLCSQITNAFSTPSEDPFSSAPMTKPVTVVASQSPAFQANGSDSAFHVLSAKPAHTALAPIAMPVRETNPWAHAPDAANKEIAATHPGTEWGPSSPDLLQAGHRRTPSEADRWLEEVSKSVRAQQPQASAVPLQPVLQPPPPAAISQPSPPFQGSAFLTSQPVPVGVVPPLQPAFVPTQSYPVANGMPYPAPNVPVVGITPSQMVANVFGTAGHSQVAHSRQSPSLVKQQTFPQYETSSAATTSPFFKPPAQHLNGSAAFNGVDDGRLASGDKHTEFPAGTCPVDPFEAQWAALESKSKQRTNPSPTNPFSSDLQKTFEIEL +>XP_004840188.1_PREDICTED:_protein_CASP_isoform_X7 +MAANVGSMFQYWKRFDLQQLQRELDATATVLANRQDESEQSRKRLIEQSREFKKNTPEDLRKQVAPLLKSFQGEIDALSKRSKEAEAAFLNVYKRLIDVPDPVPALDLGQQLQLKVQRLHDIETENQKLRETLEEYNKEFAEVKNQEVTIKALKEKIREYEQTLKSQAETIALEKEQKLQNDFAEKERKLQETQMSTTSKLEEAEHKLHSLQTALEKTRTELFDLKTKYDEETTAKADEIEMIMTDLERANQRAEVAQREAETLREQLSSANHSLQLASQIQKAPDVAIEVLTRSSLEVELAAKEREIAQLVEDVQRLQASLTKLRENSASQISQLEQQLSTKNSTLKQLEEKLKGQADYEEVKKELNILKSMEFAPSEGAGTQEAAKPLEVLLLEKNRSLQSENAALRISNSDLSGRCAELQVHVTEAMAITAEQRELIARLEQDLSTIQSIQRPDAEGAAEKIPEPIKEATALFYGPVAPASGSLPEGQVDSLLSIISSQRERFRARNQELEAESRLAQHTIQALQGELDSLRADNIKLFEKIKFLQSYPSRGSSSDDTEQRYSSQYEERLDPFSSFSKRERQRKYLSLSPWDKATLSMGRLVLSNKMARTISFFYTLFLHCLVFLVLYKLAWSESVERDCTATCAKKFADHLHKFHENDNGAAAGDLWQ +>XP_004856655.1_PREDICTED:_neural_cell_adhesion_molecule_1_isoform_X10 +MLQTKDLIWTLFFLGTAVSLQVDIVPSQGEISVGESKFFLCQVAGDAKDKDISWFSPSGEKLSPNQQRISVVWNDDSSSTLTIYNADIDDAGIYKCVVSGEDGSESEATVNVKIFQKLMFKNAPTPQEFKEGEDAVIVCDVVSSLPPTIIWKHKGRDVILKKDVRFIVLSNNYLQIRGIKKTDEGTYRCEGRILARGEINFKDIQVVVNVPPTVQARQSIVNATANLGQSVTLVCDAEGFPEPTMSWTKDGEPIENEEDDEKYIFSDDSSELTIRKVDKNDEAEYVCIAENKAGEQDASIHLKVFAKPKITYVENQTAMELEEQVTLTCEASGDPIPSITWRTSTRNISSEEKASWTRPEKQETLDGHMVVRSHARVSSLTLKSIQYTDAGEYICTASNTIGQDSQSMYLEVQYAPKLQGPVAVYTWEGNQVNITCEVFAYPSATISWFRDGQLLPSSNYSNIKIYNTHSASYLEVTPDSENDFGNYNCTAVNRIGQESLEFILVQADTPSSPSIDQVEPYSSTAQVQFDEPEATGGVPILKYKAEWRALGEEVWHSKWYDAKEANMEGIVTIMGLKPETTYAVRLAALNGKGLGEISAASEFKTQPVHSPPPPAPASSSTLAPLSSPAKGEPSAPKLEGQMGEDGNSIKVNLIKQDDGGSPIRHYLVKYRALSSDWKPEIRLPSGSDHVMLKSLDWNAEYEVSVVAENQQGKSKPAHFVFKTSAQPTAIPANGSPTAGLSTGAIVGILIVIFVLLLVVVDITCYFLNKCGLLMCIAVNLCGKAGPGAKGKDMEEGKAAFSKDESKEPIVEVRTEEERTPNHDGGKHTEPNETTPLTEPEKGPVEAKLECQESETKPAPAEVKTVPNDATQTKENESKA +>XP_004849847.1_PREDICTED:_phospholipid-transporting_ATPase_IA_isoform_X4 +MPAMRRTVSEIRSRAEGYEKTDDVSEKTSLADQEEIRTIFINQPQLTKFCNNHVSTAKYNIITFLPRFLYSQFRRAANSFFLFIALLQQIPDVSPTGRYTTLVPLLFILAVAAIKEIIEDIKRHKADNAVNKKQIQVLRNGAWEIVHWEKVNVGDIVIIKGKEYIPADTVLLSSSEPQAMCYIETSNLDGETNLKIRQGLPTTSDIKDIDSLMRIAGRIECESPNRHLYDFVGNIRLDGHGTVPLGADQILLRGAQLRNTQWVHGIVVYTGHDTKLMQNSTSPPLKLSNVERITNVQILILFCILIAMSLICSVGSAIWNRRHSGKDWYLNLSYGGANNFGLNFLTFIILFNNLIPISLLVTLEVVKFTQAYFINWDLDMHYEPTDTAAMARTSNLNEELGQVKYIFSDKTGTLTCNVMQFKKCTIAGVAYGQNSQFGDEKTFNDPSLLENLQNNHPTAPIICEFLTMMAVCHTAVPEREGEKIIYQAASPDEGALVRAAKQLHFVFTGRTPDSVIIDSLGQEERYELLNVLEFTSARKRMSVIVRTPSGKLRLYCKGADTVIYERLAETSKYKEITLKHLEQFATEGLRTLCFAVAEISESDFQEWRAIYQRASTSVQNRLLKLEESYELIEKNLQLLGATAIEDKLQDQVPETIETLMKADIKIWILTGDKQETAINIGHSCKLLKKNMGMIVINEGSLDGTRETLSRHCTVLGDALRKENDFALIIDGKTLKYALTFGVRQYFLDLALSCKAVICCRVSPLQKSEVVEMVKKQVKVITLAIGDGANDVSMIQTAHVGVGISGNEGLQAANSSDYSIAQFKYLKNLLMVHGAWNYNRVSKCILYCFYKNIVLYIIEIWFAFVNGFSGQILFERWCIGLYNVMFTAMPPLTLGIFERSCRKENMLKYPELYKTSQNALDFNTKVFWVHCLNGLFHSVILFWFPLKALQYGTVFGNGKTSDYLLLGNFVYTFVVITVCLKAGLETSYWTWFSHIAIWGSIALWVVFFGIYSSLWPAVPMAPDMSGEAAMLFSSGVFWTGLLFIPVASLLLDVVYKVIKRTAFKTLVDEVQELEAKSQDPGAVVLGKSLTERAQLLKNVFKKNHVNLYRSESLQQNLLHGYAFSQDENGIVSQSEVIRAYDTTKQRPEEW +>XP_012924301.1_PREDICTED:_protein_ITFG3_isoform_X1 +MMDNKDVEAEIHPLKNEDRKSQESFGNRLKNEDNLKSMPAQSRLSRCRTVAFFLSLFICLFVVFVVSFIIPCPDRPVSQRMWKIDYNAAVTYDFLAMEDINRDKIQDVVFLYKNTNSSNNSNLSCADEGFSSPCAFVAAVSGANGSVLWERPVVQDVAFVECTTPQPSDHKVSSACILVGRPGSFLAVDLFTGETLWSHPSSFGGNTSILTPLLQVPDIDSDGAPDLLILTQEGKEVSVYIYSGSTGDQIGHRSSLGVDGVSGPLLHVTRTGAHYILLPCASSLCGCSLKGLYKKVTGRDGPFKSDPHWENMLNASTHRLLPSSGAVRYLMNVPGKAGQDVLLVSSQDCVLLDGQELTPRWTLGAAQVLRKPILGHYKPDTPAVVIENGTGINRQILLLDLSSGAILWSQTLPSFPGAPPPNSLPTADHRSAFFFWGLHELIGTNETDPRDARHSLYMFHPTLPSVLLELANVSANIIAFDVVLFEPSRHAAYILLTGPASLDVPGLVSMIKQKVRDLVPDSRVVHLGEGRPDSDQAIRGRFSWLRYRSEV +>XP_004861473.1_PREDICTED:_suppressor_of_cytokine_signaling_6 +MKKISLKTFRKSFNLSKSKEETDFMVVQQPSIASDFGKDDALFGSCYGKDMASCDINSEDEKGGKNRSKSESLMGTLKRWLSSKQKPKGKGSTPSGSCADEDTFSSSSAPMVFKDVRVKKPIRSTSLRSQHYTHTPWPRGPTNSEETYIKTEVRVKALVHSSSPSPALNAVRKDFHDLQSETVCQEQNNSLKSSDSPNGDLHFHLDEHVPVVIERKPQDYIQYTVPLDERMYPLEGSRSYCLNSSLPMEVSAVPPQVGGSSFAEDENEVNQDLVVAPEIFVDQSVNGLLIGITGVMLQSPRASRDDVPPLSPLVPTMQNNQIQRNFSGLTGTDAHVAESMCCHLNFDPYPNSAPGVARVYDSVQSSGPRVVASLTEELKKLAKQGWYWGPLTRWEAEGKLANLPDGSFLVRDSSDDHYLLSLSFRSHGKTLHTRIEHSNGRFSFYEQPDVEGHRSIVDLIKHSIRDSENGAFCYSRSPLPGSATYPVRLTSPVSRFMQVRSLQYLCRFVIRQYTRIDLIQKLPLPNKMKDYLQEKHY +>XP_004852439.1_PREDICTED:_ribonuclease_H2_subunit_C_isoform_X2 +MESGDESAMEKQRVHVRPATLHDSSPATLHLLPCEVLANRFAPVGRFFTPAIRQGADGLHVSFRGRSLRGEEVSVPPGLTGYVMVTEKREGLIGKQDFRGSENNGEEAQEPLERGFDQFIGATGSFSCFTVWGLETVPGPEAKVWGALTWPTLAAAIHAQVPED +>XP_004861051.2_PREDICTED:_centromere_protein_X_isoform_X3 +MESASAGFRKELVSRLLHLHFKDDKTKVSGDALQLMAELLRIFVVEAAVRGVRQAQAEDTALVDVDQLEKVLPQLLLDF +>XP_004850832.1_PREDICTED:_glucocorticoid_modulatory_element-binding_protein_1_isoform_X1 +MANAEVSVPVGDVVVVPTEGNEGENPEDTKTQVILQLQPVQQGLFIDGHFYNRIYEPGSENNTAVVAVETHTIHKIEEGIDASTIEANEDMEIAYPITCGESKAILLWKKFVCPGINVKCVKFNDQLISPKHFVHLAGKSTLKDWKRAIRLGGIMLRKMMDSGQIDFYQHDKVCSNTCRSTKFDLLISSARAPVPGQQTSVVQTPTSADGGITQIAISEESMEEAGLEWNSALTAAVTMATEEGVKKDSEEISEDTLMFWKGIADVGLMEEVVCNIQKEIEELLRGVQQRLLQAPFQVTDAAVLNNVAHTFGLMDTVKKVLDNRRNQVEQGEEQFLYTLTDLERQLEEQKKQAQDHRLKSQTVQNVVLMPVSTPKPPKRPRLQRPASTTVLSPSPPVQQQPQFTVISPITITPVGQSFSMGNIPVATLSQGSSPVTVHTLPSGPQLFRYATVVSSAKSSSPDTVTIHPSSSLALLSSTTMQDGSTLGNMATMVSPVELVAMESGLTSAIQAVESTSEDGQTIIEIDPAPDPEAEDTESKAVILETELRTEEKVVAEMEEHQHQVHNVEIVVLED +>XP_004860428.1_PREDICTED:_chondroitin_sulfate_glucuronyltransferase_isoform_X2 +MQVVSHGDERPAWLMSETLRHLHTHFGADYDWFFIMQDDTYVQAPRLAALAGHLSINQDLYLGRAEEFIGAGEQARYCHGGFGYLLSRSLLLRLRPHLDGCRGDILSARPDEWLGRCLIDSLGVGCVSQHQGQQYRSFELAKNRDPEKEGSSAFLSAFAVHPVSEGTLMYRLHKRFSALELEWAYSEIEQLQAQIQNLTVLTPEGEAGLSWPIGLPAPFTPHSRFEVLGWDYFTEQHTFSCADGAPKCPLQGANRVDVGDAVDTALEQLNRRYQPRLRFQKRRLLNGYRRFDPARGMEYTLDLLLEAVTQRGHRRALVRRVSLLRPLSRVEILPMPYVTEATRVQLVLPLLVAEAAVATAFLEAFAASVLEPREHVLLTLLLVYGPRDGGHGAPDPFLGVKAAAAELERRYPGARLAWLAVRAEAPSQVRLMDVVSKKHPVDTLFFLTTVWTRPGPEVLNRCRMNAISGWQAFFPVHFQEFTPALSPQRSPPGPPGAGPDPPSPPGSDPSRGAPVGGRFDRQASAEGCFYNADYLAARARLAGELAGQEEEEALEGLEVMDVFLRFSGLHLFRAVEPGLVQKFSLRDCSPRLSEELFHRCRLSNLEGLGGRAQLAMALFEQEQANST +>XP_012924399.1_PREDICTED:_protein_unc-13_homolog_B_isoform_X4 +MKRLLQESEEEIIVTLGPSSKLSPEKVKAETVCSIKNKSSGPAGSLPEDNSLLPCCGSAASVTGRDKDGDLVQLCSFGQHANSQLPLGSTSSVSESGSQDFSSASITTNCQESSERSQAKSLLSRGSGHEQREPLGDVVEYIIRELQGISRLQSEIAELQQHLSQVRGSVDEVSSCVDSVLSEIEGLHVGSSSLTKMCEPCMGRPNEEAILYLYGLPEQEGENTIELVDNFLAKHLCVNGIQCSRYIKEAYRAGKAPAPRPTVVKLAHLEHRDFILQKSILLQSVGVQVASREPSWSQSCKNLQMESISFLQQLQNHSENSLNQDKTVLQMKTWDRGPMTSSYQMRAQNQHREYQIPDQQSPCFQLKNNLTKESDKFKTGAEVKGTSGTSQAINGSCGKLAERKTSLSPLHQLKEPFLVLISKEEDSEKSQFFERYSQELEACKVAKLENDCSSKSEASSCLSLPGLLKTERINAEDKLLGCEAGLDILSSKQLEDLLADKSRRFATLSSDSMVEEMIIGPETFSNMVHIDLNEEEECAAQVLKDVFDKSSCVLGSLQEDEDVEVKFYTTKLGRAIHHFRSALQGVFQKLENSGSISLEDLESNESGSQSENSDRLLGTVSSRGAQDCSVESPGSQGSESLLSVVSGEVGISVQSNQTPQDPSNFSIASNNSPLTNSLPSITLASCLGNETSSRPESPKQGRLSLEQVCAETIYLNKCINNFKNVLREKRLRQKKLLHELVQKANHLSVEDIPSEGKQEVHQIPDDGNPCLPQWLPEGPAGGLYGIDSMPDLRRKKPLPFVSDLAMSLVQSRKAGITSAMATRTSFKDEELKSHVYKKTLQALIYPISCTTPHNFEVWTATTPTYCYECEGLLWGIARQGMRCSECGVKCHEKCQDLLNADCLQRAAEKSCKHGAEDRTQNIIMAMKDRMKIRERNKPEIFEIIRDVFTVSKVAHVQQMKTVKQSVLDGTSKWSAKITITVVCAQGLQAKDKTGSSDPYVTVQVGKTKKRTKTIFGNLNPVWEEKFHFECHNSSDRIKVRVWDEDDDIKSRVKQRLKRESDDFLGQTIIEVRTLSGEMDVWYNLEKRTDKSAVSGAIRLQISVEIKGEEKVAPYHVQYTCLHENLFHYLTDIQGSGGVQIPEARGDDAWKVYFDETAQEIVDEFAMRYGIESIYQAMTHFACLSSKYMCPGVPAVMSTLLANINAYYAHTTASTNVSASDRFAASNFGKERFVKLLDQLHNSLRIDLSTYRNNFPAGSPERLQDLKSTVDLLTSITFFRMKVQELQSPPRASQVVKDCVKACLNSTYEYIFNNCHDLYSRQYQLKQELPPEEQGPSIRNLDFWPKLITLIVSIIEEDKNSYTPVLNQFPQELNVGKVSAEVMWHLFAQDMKYALEEHEKDRLCKSADYMNLHFKVKWLHNEYMRDLPALQEQVPKYPAWFEQFVLQWLDENEDVSLEFLRGALERDKKDGFQQTSEHALFSCSVVDVFTQLNQSFEIIRKLECPDPRILAHYMRRFAKTIGKVLMQYADILSTNFPAYCTKEKLPCILMNNMQQLRVQLEKMFEAMGGKELDPEAADSLKELQVKLNAVLDELSMMFGNSCRYVDSPSTLADCRCWKSTVSLRN +>XP_004855288.1_PREDICTED:_molybdenum_cofactor_sulfurase_isoform_X1 +MAGGVAGPGAERPTFTRCWDPSTLRLAHGYGPRSVRELRESEFGRLAETVYLDHAGATLFPQSQLTNFTKDLLENVYGNPHSQNITSKLTHDTVEQVRYRVLAHFHTTPEDYSMVFTSGSTAALKLVAEAFPWVSRGPENGGSQFCYLTDNHTSVVGMRKVAEARNVTSTPVSPEDMWSAEERGALACEPDCQLPHLFCYPAQSNFSGTRYPLSWIEEVRSGRLSPANVPGKWFVLLDAASYVSTSPLDLSAHQADFVPISFYKIFGFPTGLGALLINNRVAPLLRKSYFGGGTAAAYLAGEDFYIPRPSVAERFEDGTISYLDVIALKHGFDALERLTGGMENIMQYTFMLAQYTHTALSSLRYPNGAPVVQIYSDSEFSSPDVQGPIINFNVLDNGGNIIGYSEVDKMASLYNIHLRTGCFCNTGACQRHLGISNEMVKKHLEAGHVCGDSLDLIDGQPTGSVRISFGYMSSVEDAQAFLRFIIATRLCLPGGQPVPQGSTGKAGAPSAEGKAQDTPAVTGRHCVSPQEGARMDSGVWNDSSSTVNSVDLCPAMGKATRTQPTPSEKAAGILPGDLGPHIVTNLYLYPIKSCAAFEVTRWPIGKHGLLYDRSWMIVNHNGICLSQKQEPRLCLIQPFIDLQQRIMVIKAKGMEPIEMPLEEDSGRVQICQSIVCTDRINTYDCGEKISSWLSEFLGRPCHLIKQSSNFQRNAKKHGKDQSTGITATLSLVNEAQYLLVNTSSILELHQQLNTSDENGKEKLFPMKDLISRFRANIIMNGTRAFEEEKWDEVSIGSLHFQVQGPCHRCQMICINQQTGQRNQDVFQKLSESRKRKVNFGVYLIHRSLDSSSPCFLSVGSQVFSVLKENVEHHDLPASEKCQDLVS +>XP_012925973.1_PREDICTED:_probable_E3_ubiquitin-protein_ligase_DTX2_isoform_X2 +MAMAPVPSLAQVYPSPVAVAVWEWQDGLSTWHPYSATVCSYIEQQFVQQKGQRFGLGSLAHSIPLGQADPSLAPYIIDLPSWTQFRQDTGTMRAVRRHLFPQHSAPGQGITWEWLGDDGSWTAYEASVCDYLEQQMARGIQLVDLAPLGYNYTVNYATHTQTNKTSSFCRNVRRQVGPPYPVTTVIAPPGHLGVACSCQQCLHGSGTGPVSGRYRHSMTNLPAYPIPQASHRTAVVFGAHQAFAPYNKPSLSGARSAPRLNATNPWGGAPSALGSQPFFRSSLSHLGPQLLVPGPSTSGGASASLPSGPSSSLGIVPATVPVQMSKPSKVQQALAGGAPKLEPEQVIRTYTEELKTPPDEDCMICMEKLSVVSGYSDVTDSKTLGPVAVGRLAKCSHAFHLLCLLAMYSNGTKDGSLQCPSCKTIYGEKTGTQPRGKMEVFRFQVSLPGHEDCGTILIVYSIPHGIQGPEHPNPGKPFTARGFPRQCYLPDNAQGRKVLELLKVAWKRRLIFTVGTSSTTGETDTVVWNEIHHKTEMDRNVTGHGYPDPNYLQNVLAELAAQGVTENCLEQQ +>XP_004874685.1_PREDICTED:_acyl-coenzyme_A_thioesterase_11_isoform_X1 +MWGATCGGTVLPVKAGTGCYRLGCGLAQAEGLGGEWPWGPPPKQLCFLATPGLQNQSFASVFSNRTSRKSVSRAGDEDTMANSEGDRNPTEVQMSQLVLPCHTNLRGELSIGQLLKWIDTTAYLSAERHAGCPCVTASMDDIYFEHTISVGQVVNIKAKVNRAFNSSMEVGIQVTSEDLCSEKQWTVCKALATFVAHQQLSKVKLKQINPRTEEEKTEHSVAAERRRMRLLYADTIKDLLANCTIKEDPESKDCSRMVPAEKTRVESVELVLPPHANHQGNTFGGQIMAWMENVATIAASRLCRAHPTLKAIEMFHFRGPSQVGDRLVLKAIVNNAFKHSMEVGVCVEAYRQEAEPHWRHINSAFMTFVVLDADDQPQKLPWIQPQPGEGERRYREASARKKIRLDRKYIVSCKQAEVPLSVPWDPSNQVYLSYNNVSSLKMLVAKSNWVLSSEISQVRLYTLEEDKFLSFHLEMVVHVDAAQAFLLLSDLRRRPEWDRHYRSVDLVQQVDEDDAIYHVISPGLGGNAKPQDFVILASRRKPCDNGEPYIIALRSVTLPTHPEVPEYRRGETLCSGFCLWHEGDQVTKVSYYNQATPGLLNYVTTNVSGLSSEFYSTFKACEHFLLDNRNDLAPSLQTL +>XP_004869957.1_PREDICTED:_olfactory_receptor_8K3 +MEKHNFTVVTEFILLGITYWPEMQAPLFLLFLVIYLTSMLGNLGMIILTQVDPRLQTPMYFFLRHLALTDLGYSTTVGPKMLVNFVEDQNIISYYGCATQLTFLAFLLGSELFILSAMSYDRYVAICHPLLYTVIMSPRVCWVLVAIPCLYCTFVSLLISVKIFSSSFCGPNVINHFFCDCIPLISLLCSTTHEVEFIIMIFTAFNSISSLLLVLMSYLLILIAILRMKSAEGRGKAFSTCGSHLTAVTVFYGTLIFTYLQPKSSHSFDTDKVASIFYTQINPLLNPLIYSLRNKDVKYALHRIWKNICKCFSLKT +>XP_004841721.1_PREDICTED:_myocyte-specific_enhancer_factor_2C_isoform_X1 +MGRKKIQITRIMDERNRQVTFTKRKFGLMKKAYELSVLCDCEIALIIFNSTNKLFQYASTDMDKVLLKYTEYNEPHESRTNSDIVETLRKKGLNGCDSPDPDADDSVGHSPESEDKYRKINEDIDLMISRQRLCAVPPPNFEMPVSIPVSSHNSLVYSNPVSSLGNPNLLPLAHPSLQRNSMSPGVTHRPPSAGNTGGLMGGDLTSGAGTSAGNGYGNPRNSPGLLVSPGNLNKNMQAKSPPPMNLGMNNRKPDLRVLIPPGSKNTMPSVSEDVDLLLNQRINNSQSAQSLATPVVSVATPTLPGQGMGGYPSAISTTYGTEYSLSSADLSSLSGFNTASALHLGSVTGWQQQHLHNMAPSALSQLGACTSTHLSQSSNLSLPSTQSLNIKSEPVSPPRDRTTTPSRYPPHTRHEAGRSPVDSLSSCSSSYDGSDREDHRNEFHSPIGLTRPSPDERESPSVKRMRLSEGWAT +>XP_012932605.1_PREDICTED:_receptor-type_tyrosine-protein_phosphatase_T_isoform_X3 +MLDPAVPTGSFMMVNSSGRASGQKAHLLLPTLKENDTHCIDFHYYFSSRDRSSPGALNVYVKVNGGPQGNPVWNVSGVVTEGWVKAELAISTFWPHYYQVIFESVSLKGHPGYIAVDEVRVLAHPCRKAPHFLRLQNVEVNVGQNATFQCIAGGKWSQHDKLWLQQWNGRDTALMVTRVVNHRRFSATVSVADTAQRSVSKYRCVIRSDGGSGVSNYAELIVKEPPTPIAPPELLAVGATYLWIKPNANSIIGDGPIILKEVEYRTTTGTWAETHIVDSPNYKLWHLDPDVEYEIRVLLTRPGEGGTGPPGPPLTTRTKCADPVHGPQNVEIVDIRARQLTLQWEPFGYAVTRCHSYNLTVQYQYVFNQQQYEAEEVIQTSSHYTLRGLRPFMTIKLRLLLSNPEGRMESEELVVQTEEDVPGAVPLESIQGGPFEEKIYIQWKPPNETNGVITLYEINYKAVGSLDPSADLSSQRGKVFKLRNETHHLFVGLYPGTTYSFTIKASTAKGFGSPVTTRIATKISAPSMPEYDTDTPLNETDTTITVMLKPAQSRGAPVSVYQLVVKEERLQNSRRAADIIECFSVPVSYRNASSLDSLHYFAAELKPANLPVTQPFTVGDNKTYNGYWNPPLSPLKSYSIYFQALSKANGETKINCVRLATKAPMGSAQVTPGTPLCLLTTGASSQNSNTVEPEKQVDNTVKMAGVIAGLLMFIIILLGVMLTIKRRRNAYSYSYYLKLAKKQKETQSGAQREMGPVASADKPTTKLSTSRNDEGFSSSSQDVNGFTDGSHGELSQPTLTIQTHPYRTCDPVEMSYPRDQFQPAIRVADLLQHITQMKRGQGYGFKEEYEALPEGQTASWDTAKEDENRNKNRYGNIISYDHSRVRLLVLDGDPHSDYINANYIDGYHRPRHYIATQGPMQETVKDFWRMIWQENSASIVMVTNLVEVGRHPAEHTVGNATLGRAASPGMVKCVRYWPDDTEVYGDIKVTLIETEPLAEYVIRTFTVQKKGYHEIRELRLFHFTSWPDHGVPCYATGLLGFVRQVKFLNPPEAGPIVVHCSAGAGRTGCFIAIDTMLDMAENEGVVDIFNCVRELRAQRVNLVQTEEQYVFVHDAILEACLCGNTAIPVCEFRSLYYNISRLDPQTNSSQIKDEFQTLNIVTPRVRPEDCSIGLLPRNHDKNRNMDVLPLDRCLPFLISVDGESSNYINAALMDSHKQPAAFVVTQHPLPNTVADFWRLVFDYNCSSVVMLNEMDSTQLCMQYWPEKTSGCYGPIQVEFVSADIDEDIIHRIFRICNMARPQDGYRIVQHLQYIGWPAYRDTPPSKRSLLKVVRRLEKWQEQYDGREGRTVVHCLNGGGRSGTFCAICSVCEMIQQQNIIDVFHIVKTLRNNKSNMVETLEQYKFVYEVALEYLSSF +>XP_004839166.1_PREDICTED:_dnaJ_homolog_subfamily_C_member_27_isoform_X1 +MEANLPKRKEPSKSLRIKVISMGNAEVGKSCIIKRYCEKRFVSKYLATIGIDYGVTKVQVRDREIKVNIFDMAGHPFFYEVRNEFYKDTQGVILVYDVGQKESFDALDAWLAEMKQELGPHANMDNIIFVVCANKIDCTKHRCVDESEGRFWAESKGFLYFETSAQTGEGINEMFQTFYVSIVDLCENGGKRPTTNSSASFTKEQADAIRRIRNSKDSWDMLGVKPGASREELNKAYRKLAVLLHPDKCVAPGSEDAFKAVVNARTALLKSIK +>XP_012933567.1_PREDICTED:_lethal(2)_giant_larvae_protein_homolog_2_isoform_X3 +MPSNPRTQEASGRHLSVGAFSRTLLDTFKATVLTSSLSSTLIGLQWAAANMRRFLRPGHDPARERLKRDLFQFNKTVEHGFPHQPSALGYSPSLRILAIGTRSGAVKLYGAPGVEFMGLHRENNAVVQIHFLPGQCKLATLLDDNSLHLWSLKVRDGVSELQEDESFTLRGPPGAAPSATQITVVLPHSCQELLYLGTESGNVFVVQLPSFRVLEDQTISSDAVLQGLPEEARQRRVFEMVEALQEHPRDSSQILIGYSRGLVIIWDLQRSRVLCHFLSSQQLENVSWQRDGRLIVTCHSDGSHCQWPVSSDTQQPEPLRSSMPYGPFPCKAITKIFWLTTKKGLPFTIFQGGMPRASYGDRHCISVFHNSQQTAFDFTSRVIDFTVLAEVDPSAAFDNPYALVVLAEEELVVIDLQTAGWPQVQPPYLASLHCSAITCSHHVSNIPLKLWERIIAAGSRQNAHFSAMKWPIDGGTTLAPPPPQRDLLLTGHEDGTVRFWDASGVCLRLLFRLSTVRVFLTDTDASESLNAQGEEEWPPLRKVGSFDPYSDDPRLGIQKIFLCKYSGYLAVAGTAGQVLVLELNDEAAEHTVEEVEVDLLQDQEGYRWKGHERLAARSGAVCFEPGFQPFVLVQCQPPAVVTSLALHSEWRLVAFGTSHGFGLFDHHQRRQVFVKCTLHPSDQLALEGPLSRVKSLKKSLRQSFRRMRHSRVSSRKCRPAGAPGEMQTAGITKAERTGLQNMELAPVQRKIEARSAEDSFTGFVRTLYFADTYLRDSSRHCPSLWAGTNGGTVYAFSLRVPPAERRMDEPVWAEQAKEIQLMHRAPVVGILVLDGHSVPLPEPLEVAHDLSKSPDMQGSHQLLVVSEEQFKVFTLPKVSAKLKLKLTALEGSRVRRVGVAHFGSCRVEDYGEHHLAVLTNLGDIQVVSLPLLKPQVRYSCIRREDVSGIASCVFTKYGQGFYLISPSEFERFSLSTKWLVEPRCLVDSSKTRNHSCPSNGNSMGPEKAVGRARNSGSQSDGEEKKPGPVMEHALLNDERVLKEIQSTLEGDRGSYGNWRSHQVAVGCGLSNGGGRS +>XP_004849241.1_PREDICTED:_protein_zer-1_homolog_isoform_X1 +MASDTPESLMSLCTDFCLRNLDGTLGYLLDKETLRLHPDIFLPSEICDRLVNEYVELVNAACTFEPHESFFSLFSDPRSTRLTRIHLREDLVQDQDLEAIRKQDLVELYLTNCEKLSAKSLQTLRSFSHTLVSLSLFGCANIFYEEENPGGCEDECLVNPTCQVLVKDFTFEGFSRLRFLNLGRMIDGVPVESLLRPLSSLAALDLSGIQTSDAAFLSQWKDSLVSLVLYNMDLSDDHIRVIVQLHKLRHLDISRDRLSSYYKFKLTRKVLSLFVQKLGNLMSLDISGHMILENCSISKMDEEAGQTSIEPAKSSIMPFRALKRPLQFLGLFETSLCRLTHIPAYKVSGDKNEEQVLNAIEAYTEHRPEITSRAINLLFDIARIERCNQLLRALKLVITALKCHKYDKNIQVTGSAALFYLTNSEYRSEQSVKLRRQVIQVVLNGMESYQEVTVQRNCCLTLCNFSIPEELEFQYRRVNELLLSILNPTRQDESIQRIAVHLCNALVCQVDNDHKEAVGKMGFVVTMLKLIQKKLLDKICDQVMEFSWSALWNITDETPDNCEMFLNFNGMKLFLDCLKEFPEKQELHRNMLGLLGNVAEVKELRPQLMTSQFISVFSNLLESKADGIEVSYNACGVLSHIMFDGPEAWGVCEPQREEVEERMWAAIQSWDINSRRNINYRSFEPILRLLPQGISPVSQHWATWALYNLVSVYPDKYCPLLIKEGGMPLLRDVIKMATARQETKEMARKVIEHCSNFKEENMDTSR +>XP_004838069.1_PREDICTED:_alpha-fetoprotein +MKWLVSLILIFLLRFTDSRTLHKNAYGIASTLDSSQCSSEMNLADIATIFFAQFVQEATYEEVSKMVTDLLTVVKKPTGSEQPAECFENRLSAFLEEICHERAIAGKYGLADCCAHSEEERHKCFLARKKAATVSIPPLQAPDVVTSCKVYEENREMFINKYIYEVSRRHPFLYTPTALSLAARYDKIFPSCCKAENAAECFQTQATSITKDLSESSLLNQHVCAIIRNFGPRNFQAVTITKLSQKFPKANFSEIQKLVLDVAHIHEECCHGNVLECLHDGEKIMSYICSKQDTLSSKIAECCKLPLLELGHCIIHAENDDKPEGLSSDLSKFLGDRDFGRFSPGEKTMFLASFIHEYSRRHTELAVSIILRVANGYQELLEKCFQSENTLECQNKGEQELQKYVQESQTMATRSCSLFQKLGEYYLQNAFLIAYTKKAPQLTSSELMAFTRKMVTTAATCCQLSGDKQLACGEGAADLIIGQLCIRHDASPVNPGVGICCNSSYANRRPCFSSLVVDETYVSPPFSADKFIFHKDLCQAHGVALQEMKQELLINLVKQKVQITEGQLETIIQDFSGFLEKCCHHQEQEACFAEEGPKLISKTRTSLGV +>XP_004862098.1_PREDICTED:_hematopoietic_progenitor_cell_antigen_CD34_isoform_X2 +MLLRGMPWGCAALCLLSLLPSGFTNVSPTADTTETSTLKVSSPVPTSGSHQETTEPVVPGITSPHPVSVDTMETTAAVSETTVNFTSTSGTTLFPESTNSSIQSQTSPDTWASSTPVVTTTGNTSTSNVTSEPSTAPVSVLDYSSTGTSPVATSPTELYTSSSPAPSMVQGEIKCAGIKEVKLTHSICLELNKTASCEDFKQDKGEGLVRVLCGGEAGAQAEAATCSLLLAQSEVKPQCLLLVLANSTELSRKLDLLQKHQPDLEKLGIQSYMEQDVGSHQSYSRKTLIALVTSGILLAILGTTGYFLMNRRSWSPTGERLELEP +>XP_004838963.1_PREDICTED:_transcription_factor_7-like_2_isoform_X17 +MPQLNGGGGDDLGANDELISFKDEGEQEEKSSENSSAERDLADVKSSLVNESETNQNSSSDSEAERRPPPRSESFRDKSRESLEEAAKRQDGGLFKGPPYPGYPFIMIPDLTSPYLPNGSLSPTARTYLQMKWPLLDVQAGSLQSRQALKDARSPSPAHIVSNKVPVVQHPHHVHPLTPLITYSNEHFTPGNPPPHLPADVDPKTGIPRPPHPPDISPYYPLSPGTVGQIPHPLGWLVPQQGQPVYPITTGGFRHPYPTALTVNASMSRFPPHMVPPHHTLHTTGIPHPAIVTPTVKQESSQSDVGSLHSSKHQDSKKEEEKKKPHIKKPLNAFMLYMKEMRAKVVAECTLKESAAINQILGRRWHALSREEQAKYYELARKERQLHMQLYPGWSARDNYGKKKKRKRDKQPGETNDANTPKKCRALFGLDRQTLWCKPCRRKKKCVRYIQGEGSCLSPPSSDGSLLDSPPPSPHLLGSPPRDAKSQTEQTQPLSLSLKPDPLAHLAMMPPPPALLLAEAAHGKASALCPNGALDLPPAAPSSSLAQPSTSSLHSHNSLAGPQPQPLSLVTKSLE +>XP_004870120.1_PREDICTED:_serine/threonine-protein_kinase_WNK2_isoform_X6 +MDGDGGGRDAPGALMEAGRGAGPAGMAEPRVKATRPGPQRFLRRSVVESDQEEPPGLEAAEAAPAQPPQPLQRRVLLLCKTRRLIAERARGRPTAPAPAAPASQPGAPLDPGPEPAGEQEPSPDPVVAAAAAEAPDCGPREEEEGAAAAKQEDDGATEAKPEPGRARKDEPEEEDDDEDDLKAVATSLDGRFLKFDIELGRGSFKTVYKGLDTETWVEVAWCELQDRKLTKLERQRFKEEAEMLKGLQHPNIVRFYDFWESSAKGKRCIVLVTELMTSGTLKTYLKRFKVMKPKVLRSWCRQILKGLMFLHTRTPPIIHRDLKCDNIFITGPTGSVKIGDLGLATLKRASFAKSVIGTPEFMAPEMYEEHYDESVDVYAFGMCMLEMATSEYPYSECQNAAQIYRKVTCGIKPASFEKVHDPEIKEIIGECICKNKEERYEIKDLLSHAFFAEDTGVRVELAEEDHGRKSTIALRLWVEDPKKLKGKPKDNGAIEFTFDLEKETPDEVAQEMIDSGFFHESDVKIVAKSIRDRVALIQWRRERIWPALQSQEPRDSGSPDKARGPPAPLQVQVTYHGQAGQPGPPEPEEPEADQHLLPATLPTSATSLASDSTFDSGQGSTVYSDSQSSQQSMVLGSLVDATPSLVPCVCSPPVSEGPGLAHSLPSLGAFQQPAATPSLSVGSIPAPTHPPLLQQHFPEPMMSFAPVLPPPSAPVPAGPGHPVPPAQQPPPMAQPPALPQVLAQQPLGAVQPVPPHLPPYLAPASQVVAPTQLKPLQMPQPPLQALAQVPPQMPTMPVVPPITPLGAIDGLPQALTDLPAANVAPVPPPQYFSPSVILPNLTTPLPASPALPLQAVKLPHPTGAPLGMPCQTIVPNAPATIPLLAVAPQGMAALSIHPGVAQLPAQLPTQLPAQLPAQPVYPAAFPQMVPGDIPPSPHHTVQSLRATPLQPGPPVPTVPPMPTMPPVPTPTPQPLLPSVTHLPEQVAPAAAATGSQVLLGHLPPYTVDVAVPVPAVPLPPAVLSPPLPDVLPPAAPELLPKFPSSLAPAVVAAPQSVTTQTSALLQPAVLPLPAGPLIPGPCPAVQLMVEPAQEEQASQDKPPGPLQSCESFGGSDVTSGKELSDGCEGAFGGGRLEGRAARRHHRRSTRARSRQERTARPRLTILNVCNTGDKMVECQLETHNHKMVTFKFDLDGDAPDEIATYMVEHDFILPAERETFIEQMKDVMDKAEDMLSEDTDADQGSDAGASPPPLGTCGLVEGEEGRQSPANAPVYQQNVLHTGKRWFIICPVAEHPAADVPESSPPLPVSSLKPEASQDPALYTDQFLKEQPSFPAGQQLLSQADPSDPPGGTPAPLAPPSSPVTVVPQDAAAPASTVPEPAAGTAIQAEGPGTSQGPASEHETTQPLAETHDTQHATQPLSTGQGPSTLPPKVSSCPTGLGEPSSNREISTPGEPLPAVVPGPCPPGGPLQPAVGQPPPPLPTAVGAIGLAVPQLPSPPLGPATTPPPPLALESDGEGPPPRVGFVDNTIKSLDEKLRTLLYQEHVPTSSASAGTPVEAGDRDFSLEPPRGDGPHREALGADLTRPPQPSLEKSETTPAGWGPVEQEQEQGASSPMTAESSSSNTLGCDSDGQVASDPPAPPSAPKAVPASASPACIQPTGQKGRVPREASEEPTQSHLGIVTEGGQLSCPQTHGTRTSGSSRKRPGQQEGSSPAKTVGRFSVVSSQDEWTLASPHSLRYSAPPDVYLDELPSTPDVKLAVRRVQTASSIEVGVGEPASSDSGDECLRRRPPVQKQSSLPSAGAVASDLVKKATAFLHRSSRAGSLDPETPSRASVKVPTISVTSFHSQSSYISSDNDSEFEDADIKKELRSLREKHLKEISELQSQQKQEIEALYCRLGKPLPPNVGFFHTAPPTGRRRKTSKGKLKAGKLLNPLVQQLKVVASSTGSALKRLCLGKEHSSRSSTSSLAPGPEPGPQPTLHIQTQVNNSNNKKGTFTDDLHKLVDEWTTNTAGAAQLKPTLNQLKQTQKLHGMETPGEARAMTIPRVGVAMPYLAPAPGPLSTAAIPGAILALPVPTPGTAHASLPSPPCARLLGQYGGLCPAPVPWGPWEAQGSPPGVWGTWNPAQVPVLPVFLRPPAVSTPSHQLHIT +>XP_004860390.1_PREDICTED:_sonic_hedgehog_protein +MGEMLLPARCLLLVLVSSLLVCSGLACGPGRGFGKRRHPKKLSPLAYKQFIPNVAEKTLGASGRYEGKISRSSERFKELTPNYNPDIIFKDEENTGADRLMTQRCKDKLNALAISVMNQWPGVKLRVTEGWDEDGHHSEESLHYEGRAVDITTSDRDRSKYGMLARLAVEAGFDWVYYESKAHIHCSVKAENSVAAKSGGCFPGSATVHLEQGGTKLVKDLRPGDRVLAADDQGRLLYSDFLTFLDRDDGAKKVFYVIETQEPRERLLLTAAHLLFLAPPQNNSATGELEAAAGGALGRRALFASRVRPGQRVYVVAERDGDRRLLPAAVHSVTLREEAAGAYAPLTAQGTILINRVLASCYAVIEEHSWAHRAFAPFRLAHALLAALSPARTDRGDGGGGGGGGGRVPQPVPGAAEGVHWYSRLLYRIGTWLLDGETLHPLGMAVASS +>XP_004861831.1_PREDICTED:_pre-mRNA-splicing_factor_18_isoform_X2 +MDVLKSEILRKRQLVEDRNLLVENKKYFKRSELAKKEEEAYFERCGYKIQPKEEDQKPLTSSNPVLELELAEEKLPMTLSRQEVIRRLRERGEPIRLFGETDYDAFQRLRKIEILTPEVNKGLRNDLKAALDKIDQQYLNEIVGGQEPGEEDTQNDLKVHEENTTIEELEALGESLGKGNDHKDMDIITKFLKFLLGVWAKELNAREDYVKRSVQGKLNSATQKQTESYLRPLFRKLRKRNLPADIKESITDIIKFMLQREYVKANDAYLQMAIGNAPWPIGVTMVGIHARTGREKIFSKHVAHVLNDETQRKYIQGLKRLMTICQKHFPTDPSKCVEYNAL +>XP_004841050.1_PREDICTED:_calcium-responsive_transactivator +MSVAFASARPRAKGEVTQQTIQKMLDENHHLIQCILDYQSKGKTAECTQYQQILHRNLVYLATIADSNQNMQSLLPAPPTQNMNLGPGGLSQSGSSQGLHPQGSLSDAISTGLPPASLMQGQIGNGPNHVSMQQTAQSTLPTTSMSMSGSGHGTAPGYSHSGPASQSVPMQGQGAIGNYVSRTNINMQSNPVSMMHQQAATSHYNSAQGGSQHYQGQSSIAMMGQGGQGSSMMGQRPMAPYRASQQGSSQQYLGQEEYYSEQYSHSQGASEPMSQQYYPDGHGDYAYQQSSYTEQSYDRSFEESTQHYYEGGNSQYSQQQAGYQQGTAQQQAYPQQQYPSQQSYPGQQQGYGPAQGAPSQYSSYQQGQGQQYGSYRASQSGPSAQQQRPYGYEQGQYGNYQQ +>XP_004871542.1_PREDICTED:_bcl-2-associated_transcription_factor_1_isoform_X1 +MGRSNSRSHSSRSKSRSQSSSRSRSRSHSRKKRYSSRSRSRTYSRSRSRDRIYSRDYRRDYRNNRGMRRPYGYRGRGRGYYQGGGGRYHRGGYRPVWNRRHSRSPRRGRSRSRSPKRRSVSSQRSRSRSRRSYRSSRSPRSSSSRSSSPYSKSPVSKRRGSQEKQTKKPEGEPQEESPLKSKSQEEPKDTFEHDPSESIDEFNKSATSGDIWPGLSAYDNSPRSPHSPSPIATPPSQSSSCSDAPMLSTVHSAKNTPSQHSHSIQHSPERSGSGSIGNGSSRYSPSQNSPIHHIPSRRSPAKTIIPQNAPRDESRGRSFYPDGGDQETAKTGKFLKRFTDEESRVFLLDRGNTRDKEAPKEKGSEKGRAEGEWEDQEALDYFSDKESGKQKFNDSEGDDTEETEDYRQFRKSVLADQGKNFAAASHRNTEEEGSKYKSKVSLKGNRESDGFREEKNYKLKETGYVVERPSTTKDKHKEEDKSSERITVKKETQSPEQVKSEKLKDLFDYSPPLHKNLDAREKSTFREESPLRIKMIASDSHRPEVKLKMAPVPLDDSNRPASLTKDRLLASTLVHSVKKEQEFRSIFDHIKLPQASKSTSESFIQHIVSLVHHVKEQYFKSPAVTLNERFTSYQKATEEHSTRQKSPEIHRRIDISPSALRKHTRLAGEERVFKEESQKGDKKLRCDSADLRHDIDRRRKERSKERGDSKGSRESSGSRKQDKTPKDYKEYKSYKDDSKHKSREQDHSRSSSSSASPSSPSSREEKESKKEREEEFKTHHELKEYSGFAGVSRPRGTFFRIRGRGRARGVFAGTNTGPNNSNTSFQKRPKEEEWDPEYTPKSKKYFLHDDRDDGVDYWAKRGRGRGTFQRGRGRFNFKKSGSSPKWTHDKYQGDGIVEDEEETMDNNEDKKDRRKEEKE +>XP_012933865.1_PREDICTED:_FERM_domain-containing_protein_5_isoform_X5 +MCFRVKFYPADPAALKEEITRYLVFLQIKRDLYHGRLLCKTSDAALLAAYILQAEIGDYDPGKHPEGYSSKFQFFPKHSEKLERKIAEIHKTELSGQTPATSELNFLRKAQTLETYGVDPHPCKDVSGNAAFLAFTPFGFVVLQGNKRVHFIKWNEVTKLKFEGKTFYLYVSQKEEKKIILTYFAPTPEACKHLWKCGIENQAFYKLEKSSQVRTVSSSNLFFKGSRFRYSGRVAKEVMESSAKIKREPPEIHRAGMVPSRSCPSITHGPRLSSVPRTRRRAVHISIMEGLESLRDSAHSTPVRSSSHGDNFLPHVRSSRADSNERVAVISDEAYSPADSVLPTPVAEHSLELMLLSRQINGATCSIEEEKESEASTPTTTEAETLGRELRALCQGHGRPEEEQVNKFVLSVLRLLLVTMGLLFVLLLLLIILTESDLDIAFFRDIRQTPEFEQFHYQYFCPLRRWFACKIRSVVSLLIDT +>XP_004865828.1_PREDICTED:_zinc_finger_and_BTB_domain-containing_protein_7A_isoform_X1 +MLSDLPSLPQVSVRKMAGGVDGPIGIPFPDHSSDILSGLNEQRTQGLLCDVVILVEGREFPTHRSVLAACSQYFKKLFTSGAVVDQQNVYEIDFVSAEALTALMDFAYTATLTVSTANVGDILSAARLLEIPAVSHVCADLLDRQILAADAGGDSGQLDLVDQADQRNLLRAKEYLEFFQSNPMNSLPPTAAANFPWSAFGASDDDLDATKEAVAAAVAAVAAGDCNGLDFYGPGPPAERAPVGDGDEGDSNPGLWPEQDEDAPTTAGGLFQPPVAPPAATQNGHYGRAGEEEAASLSEAAPEPGDSPGFLSGAAEGEDGDAGDVDGLAASTLLQQMMSSVGRAGALAGGDSDEESRADDKGVMDYYLKYFSGAHEGDVYPAWSQKGEKKIRAKAFQKCPICEKVIQGAGKLPRHIRTHTGEKPYECNICKVRFTRQDKLKVHMRKHTGEKPYLCQQCGAAFAHNYDLKNHMRVHTGLRPYQCDSCCKTFVRSDHLHRHLKKDGCNGVPSRRGRKPRVRGGAPDPTLGTGVPPPGAPSSAPPGSPDTATAAATTTRRNGQEKHFKDQEEDEEATSPDGSSGRLNVAGASGGDDSGGGPGATADGNFTAGLA +>XP_012927228.1_PREDICTED:_MAP_kinase-activated_protein_kinase_5_isoform_X5 +MLFCLTTCCPRGRVCVKKCTQERFALKILLDRPKARNEVRLHMMCATHPNIVQIIEVFANSVQFPHESSPRARLLIVMEMMEGGELFHRISQHRHFTEKQASQVTKQISLALQHCHLLNIAHRDLKPENLLFKDNSLDAPVKLCDFGFAKIDQGDLMTPQFTPYYVAPQVLEAQRRHQKEKSGIIPTSPTPYTYNKSCDLWSLGVIIYVMLCGYPPFYSKHHSRTIPKDMRRKIMTGSFEFPEEEWSQISEMAKDVVRKLLKVKPEERLTIEGVLDHPWLNSTEALDNVLPSAQLMMDKAVVAGIQQAHAEQLANMRIQDLKVSLKPLHSVNNPILRKRKLLGTKPKDGVYIHDHENGAEDSNVALEKLRDVIAQCILPQAGKGENEDEKLNEVMLEAWKYNRECKLLRDTLQSFSWNVSGHGFTDKVDRLKLAEIVKQVIEEQTTSHESQ +>XP_004838078.1_PREDICTED:_proton-coupled_amino_acid_transporter_4 +MEAAPAAADEAGLEELDMDVMRPLINEQNFDGSSDEEHEAELLPVQKHYQLDDQEGISFVQTLMHLLKGNIGTGLLGLPLAIKNAGIVLGPISLVFIGIISVHCMHILVRCSHFLCQRFKKSTLGYSDTVSFAMEVSPWSCLQKQAAWGRTVVDFFLVITQLGFCSVYIVFLAENVKQIHEGFLESKVFVSNSTNSSNPCERRSVDLRIYMLCFLPFIILLVFIRELKNLFVLSFLANVSMAVSLVIIYQYVVRNMPDPHNLPIVAGWKKYPLFFGTAVFAFEGIGVVLPLENQMKESKRFPQALNIGMGIVTALYVTLATLGYMCFRDEIKGSITLNLPQDVWLYQSVKILYSFGIFVTYSIQFYVPAEIIIPGVISKFHAKGKQICEFGIRSFLVSITCAGAILIPRLDIVISFVGAVSSSTLALILPPLVEILTFSKEHYNIWMILKNISIAFTGVVGFLLGTYVTVEEIVYPTPRVITGTSQSPSLNWNSTCLTSGLK +>XP_004852360.1_PREDICTED:_E3_ubiquitin-protein_ligase_pellino_homolog_3_isoform_X2 +MVLEGNPEVGSPRTSDLQHTGNKGSCLLSSPGEGAQPGEELIKYGELIVLGYNGCLASGDKGRRRSRLALSRRPHANGVKPDVMHHISTPLISKALSNRGQHSISYTLSRSHSVIVEYTHDSDTDMFQIGRSTENMIDFVVTDTSPGGSAAEGPSAQSTISRYACRILCDRRPPYTARIYAAGFDASSNIFLGERAAKWRTPDGLMDGLTTNGVLVMHPAGGFSEDSAPGVWREISVCGNVYTLRDSRSAQQRGKLVENESNVLQDGSLIDLCGATLLWRTPAGLLRAPTLKQLEAQRQEANAARPQCPVGLSTLAFPSPARGRTAPDKQQPWVYVRCGHVHGYHGWGCRRERGPQERECPLCRLVGPYVPLWLGQEAGLCLDPGPPSHAFAPCGHVCSEKTARYWAQTPLPHGTHAFHAACPFCGAWLTGEHGCVRLIFQGPLD +>XP_004872256.1_PREDICTED:_cytosolic_5'-nucleotidase_3A_isoform_X2 +MTNQESAVHMKMMPEFQRSSVRIKNPTRVEEIICGLIKGGAAKLQIITDFDMTLSRFSYKGKRCPTCHNVIDNCKLVTDECRKKLLQLKEQYYAIEVDPVLTVEEKYPHMVEWYTKSHGLLVEQGIPKAKLKEIVAESDVMLKEGYENFFDKLQQHSIPVFIFSAGIGDVLEEVIRQAGVYHPNVKVVSNFMDFDENGMLKGFKGELIHVFNKHDGALKNTDYFSQLKDNSNIILLGDSQGDLRMADGVANVEHILKIGYLNDRVDELLEKYMDAYDIVLVKDESLEVANSILQKVL +>XP_004847251.1_PREDICTED:_zinc_finger_CCHC_domain-containing_protein_4_isoform_X1 +MAAPRYGRESVEAEPGAGSQGTSGVEMVLLSDPASPAPLCPHGPTLLFVKMSQGKEETRRFYACSACRDRKDCNFFQWEDEKLSGARLTAREAHNQRCRPPLSRMQCVQRYLRFIQLPLTERKFCCSCQQLLLPDEWGEHREHQVVGDVSVTQLRRPSQLLYPLENKKTNAQYLFADRTCQFLVGLLSALGFRRVLCVGTPRLHELIRLTASGDKKSNLKSLLLDIDFRYSQFYMEDSFCHYNMFNHHFFDGKPALEVCRAFLQEDKGEGVIMVTDPPFGGLVEPLAVTFKKLITVWKEGQVQDDSHQEMPIFWIFPYFFEARICHFFPSFCMLDYQVDYDNHALYKHGKTGRKQSPVRIFTNIPPNKITLPTEEGYRFCPPCQRYVSLENQHCEHCNSCTSKDGRKWKHCFLCKKCVKPSWIHCSICNHCAVAGHSCEGPKDGCFICGELGHKRSSCPNISTSKEANKAVRNQKQRKSNKMKMETTKGQSMNHTSVTRKKKKRERAHQYLCS +>XP_004854508.1_PREDICTED:_glutaredoxin-like_protein_C5orf63_homolog +MLWFQGNSMQLVKSSFVLFLRNLSALKTTLPVLTLFTKDPCPLCDEAKELLKPYKNRFILQEVDITLPENSAWYERYKFDIPVFHLNGRFLMMHRVNISKLEKQLLKLEQQGAGC +>XP_012929753.1_PREDICTED:_lysosomal_amino_acid_transporter_1_homolog_isoform_X4 +MLWRKLGASNFSSCPNGSILWIWDVFHECVQDGWDKASVSLGLISILCFAASTFPQYIKACKTGNMDQALSVWFLLGWIGGDSCNLIGSFLADQLPLQSYTAVYYVLADLVMLTLYFHYKFKKRPSLLSAPINSVLLFISGTVCITPLLSSTGPVAAPREAFQGRMLLSVEPGNKPFTKQEIIGFVVGSVSSVLYLLSRLPQIRTNFLRKSTQGISYSLFALVMLGNALYGLSVLLKNPEVGQSEGSYMLHHLPWLVGSLGVLLLDTIISIQFLVYRDVIEAASLEREPLLSSCAGPE +>XP_004849923.1_PREDICTED:_rab11_family-interacting_protein_5_isoform_X3 +MALVRDAEPASGPSRWLPTHVQVTVLRARGLRGKSSGVGSTSDAYTVIQVGREKYSTSVVEKTQGCPEWREECSFELPPGALDGLLRAQEADAGPAPWASGSAAACQLVLTTMHRSLIGVDKFLGQATVALDEVFGAGRAQHTQWYKLHSKAGKKEKERGEIQVTIQFTRNNLSASMFDLSIKDKPQSPFSKLKDKMKGKKKYDLESASAILPSSALEDPELGSLGKMGKAKGFFLRNKLRKSSLTQSNTSLGSDSTLSSASGSLAYQGPGAELLTRSPSRSSWLSSEGGRDSIQSPKLLTHKRTYSDEASQLRAAPTRALLDLQGHLDAGPRSSLCVNGSHIYNEEPQAPARHRSSISGPFPPSSSLHSVSSRPSEEGSRSSDDSWGRGSRGAGSSSEVVPGPEELSTQAKAQAREERAQTPEGKPVQVATPILVSSEAVVEKEGARKEERKPRMGLFHHHHQGLSWSELGRRGSIGEKGGPTVGASPQHLSSGEDKAKSSWFGLRESKESSQKPSPHPVKPLSATPVEGSPDRKQPRSSLSTALSSGLEKLKTVTSGSIQPVAPAPQLGQTVDTKKLKDSAVPDQSAKYYHLTHDELIGLLLQRERELSQRDEHVQELESYIDRLLVRIMETSPTLLQIPPGPPK +>XP_012933928.1_PREDICTED:_FERM_domain-containing_protein_4A_isoform_X5 +MVLQAAVAPNGAQRRLLKIPCGSLRRRSVERMTEGRRCQVHLLDDRKLELLVQPKLLAKELLDLVASHFNLKEKEYFGIAFTDETGHLNWLQLDRRVLEHDFPKKSGPVVLYFCVRFYIESISYLKDNATIELFFLNAKSCIYKELIDVDSEVVFELASYILQEAKGDFSSNEVVRSDLKKLPALPTQALKEHPSLAYCEDRVIEHYKKLNGQTRGQAIVNYMSIVESLPTYGVHYYAVKDKQGIPWWLGLSYKGIFQYDYHDKVKPRKIFQWRQLENLYFREKKFSVEVHDPRRASVTRRTFGHSGIAVHTWYACAALIKSIWAMAISQHQFYLDRKQSKSKIHAARSLSEIAIDLTETGTLKTSKLANMGSKGKIISGSSGSLLSSGSQESDSSQSAKKDMLAALKSRQEALEETLRQRLEELKRLCLREAELTGRLPVEYPLDPGEEPPTVRRRIGTAFKLDEQKVLPKGEEAELERLEREFAIQSQITEAARRLASDPNVSKKLKKQRKTSYLNALKKLQETENAINEHRIKSGKKPTQRASLVIDDGNIASEDSSLSDALVLDDEDPAVTSAMSPLQSPHKGLPPRPPALHRPAPPQSLEGLRQMHFHRGDYDKSPVKPKMWSESSLDEPYEKAKRRSPHGHAQAGSHKRFPSTGSCAEAGGASPLQSSPVRGLLHWNSQSSMPSTPDLRVRSPHYVHSTRHRSSSLESQGKLLGSENDTGSPDFYTPRTRSSNGSDPMDDCSSCTSHSSSEHYYPAQANANYSTLAEDSPSKARQRRRQRQRAAGLLGAAPSGSMPDLARGAAGGVYLHSQSQPGSQYRIKEYPLYVEGGAPVVVRSLESDQEGHYSVKAQFKTSSSYTAGGLFREGDAGRLTPSRSQILRTPSLGREGAQDRGRAAVSDELRQWFQRSSAAQREPGRLSHASSASSDSGSQHSASPQSTFVAHSRVTRMPQMCKATSAALPQSQRSSTPSSEVGATPPSSPHHALAWQTGSYSDSCFPDSSLYPELADVQWYGQEKAKPGTLV +>XP_004845632.1_PREDICTED:_TGF-beta-activated_kinase_1_and_MAP3K7-binding_protein_1_isoform_X1 +MAAQRRSLLQSEQQPSWTDDLPLCHLSGVGSASNRSYSADGKSTESHPPEDSWLKFRSENNCFLYGVFNGYDGNRVTNFVAQRLSAELLLGQLNAEHTEADVRRVLLQAFDVVERSFLESIDDALAEKASLQSQLPEGVPQHQLPPQYQKILERLKVLEREISGGAMAVVAVLLNNKLYVANVGTNRALLCKSTVDGLQVTQLNMDHTTENEDELFRLSQLGLDTGKIKQVGIICGQESTRRIGDYKVKYGYTDIDLLSAAKSKPIIAEPEIHGAQPLDGVTGFLVLMSEGLYKALEAAHGPGQANQEIAAMIDTEFAKQTSMDAVAQAVVDRVKRIHGDTFASGGERAKFCLRHEDMTLLVRNFGYPLGEMSQPTPSPASAAGGRVYPVSVPYSSTQSTSKTSVTLSLVMPSQGQMVNGAHSASTLDEATPTLTNQSPTLTLQSTNTHTQSSSSSSDGGLFRARPAHSLPPGEDGRVEPYVDFAEFYRLWSVDHGEQSVMTAP +>XP_004856843.1_PREDICTED:_NLR_family_member_X1_isoform_X1 +MRWGLHLSRASWGSGLGRIPRPPDRIPFLMHWSWPPKGEHPLGPLRAFVRYHRSSADTAPPPGRHGQLFQSTSAAGKGLEAIHLHRQNLAEWFSRLPREERQFGPTFALDTVHVDPVIRESTPDELLRPSSGLALDHQSPSAGLPPLALSQLFNLDACGRRVQTVVLYGTVGTGKSTLVRKMVLDWCYGRLPTFKLVIPFSCEDLSSLGPAPASLCQLVAQRYPPLKEILTLMPAAGPRLLFVLHGLERLNLDFRLAGTALCSDLKEPAAPAAIIVNLLRKYMLPEASILVTTRPSAIGRIPSKYVGRYGEICGFSDTNLQKLYFQLRLNQPDCGHSAGFSATPAQRDHLVQMLSRNLEGHHQIAAACFLPSYCWLVCATLHFLHAPTPAGQTLTSIYTSFLRLNFSGETLDSTDPSNLSLMAYAARTMGKLAYEGVSSRKTYFSEEDVRGCLEAGIKTEEEFQLLHVFHRDALRFFLAPCVEPGHRGTFVFTVPAMQEYLAALYIVLGLRKTTLQRVGKEAAELMGRVGEDVSLVLGIVAKLLPLRILPLLFNLLKVVPQVFGRLVGKSREAVAQAMVLEMFREEDYYNDDVLDQMGASILGVEGPRRHPDEPPEDEVFELFPMFMGGLLSAHNRAVLAQLGCPIKNLDALENAQAIKKKLGKLGQQVLPPSELLDHLFFHYEFQNQRFSNELLSSLRQLNLAGVRMTPLKCTVVAAVLGSGRHVLDEVNFASCQLDPAGLRTLMPVFLRARKLGLQLNSLGPEACRDLRDLLLHDHCQITTLRLSNNPLTAAGVALLLEGLKGNTSLTHLSLLHTGLGDEGLELLAAQLDHNHQLQELNVAYNGAGDKAALALAKAAWEHPSLELLHLYFNELSSEGRQVLRDLGGTAEGGTRVVASLTEGAVVSEYWSMILSEVQRNLNSWDWTRVRRHLELLLRDLEDNRGATLNPWRKAQLLRVEGEVKALLEQLGGPGS +>XP_012924884.1_PREDICTED:_transmembrane_protein_adipocyte-associated_1_isoform_X3 +MLFLAQGWDKCWSSCSAPSKRFRKPGKAWGGGTNHPRPGDPRLRSQHVRAVPGDPVPDGPPKPKSRLEAERRRPRSRLLTASRGWKVPRRSQGALLERGRDPGHFLGPAAGWMDTPEWVMGANRSTAVPLPGAPNISVPHRCLLLLYEDVGTSRVWYWDLLLLIPNVLFFVFLLWKLPFARAKIRLSSSPIFITFYILGEPDFSLRGGPGAWDKVFVVALVGIARAVVSMTVSTSSATMVADKILWEITRFFLLAIKLSVVILGLAFGHLESKSSIKRVLAITTVLSLTYSVTQVRGGSQGTLEILYPDAHLSAEDFNIYGHGGRQFWLVSSCFFFLVYSLVVVLPKTPLKERISLPSRRSFYVYAGILALLNLVQGLGSALLCANIIEGLCCVDATTFLYFSFFAFAPLIYVAFLRSFFGSEPKILFSYKCQVDQTEEPDMHLPQPYAVAGREGMEASGATSTQFASGGVAYLDDVASMPCHTGSINSTDSERRKTINA +>XP_004849365.1_PREDICTED:_cyclin-dependent_kinase_9_isoform_X2 +MAKQYDSVECPFCDEVTKYEKLAKIGQGTFGEVFKAKHRKTGQKVALKKVLMENEKEGFPITALREIKILQLLKHENVVNLIEICRTKASPYNRCKGSIYLVFDFCEHDLAGLLSNVLVKFTLSEIKRVMQMLLNGLYYIHRNKILHRDMKAANVLITRDGVLKLADFGLARAFSLAKNTQPNRYTNRVVTLWYRPPELLLGERDYGPPIDLWGAGCIMAEMWTRSPIMQGNTEQHQLALISQLCGSITPEVWPNVDKYELFEKLDLVKGQKRKVKDRLKAYVRDPYALDLIDKLLVLDPAQRIDSDDALNHDFFWSDPMPSDLKGMLSTHLTSMFEYLAPPRRKGSQITQQTTNQSRNPAATNQTEFERVF +>XP_012924145.1_PREDICTED:_BRISC_and_BRCA1-A_complex_member_1_isoform_X1 +MEVAEPGSPTEEEEEEEEEEEEEEEEEQSAEPRPQTRSNPEGAEDRALGAQASVGSRSEGEGEAASVGDGTPNPPGAGPQPWQVPPSALEVQIRTPRVNCPEKVIICLDLSEEMSLPKLESFNGSKTNALNVSQKMIEMFVRTKHKIDKSHEFALVVVNDDTAWLSGLTSDPRELCSCLYDLETATCSTFNLEGLFSLILQKTELPVTESVQTIPPPYVVRSILLYSRPPRQPQFSLTEPMKKMFQCPYFFFDVVYIHNGAEEKEEELSWKCSSHDRAAGPQVGHLYLYEQGQRRPAPTHTSMPSSKDPPLQCLSSSSEKIIMGLEMRPSGVPALGHVCLHGQPGYQGHQLQV +>XP_004872926.1_PREDICTED:_transmembrane_protein_171_isoform_X3 +MSSIAIAEPDGDEQDRGASKLIFFLFVFGAVLLCVGLLLSIFGYQACQYEPLPDCNMVLKIAGPSCAVIGLGAVILARSRARLQLLVRRRQGNQVDSDQAFLCGESRQFAQCLIFGFLFLTSGLLVSILGIWVPGCSSDWAQDLLNETDTISAEPQICGFLSLQIMGPLIVLMGLCFFVVAHVKKKNNLSVSQDASESEEGHGPSTEPVQVTVGDSVIIFPPPPPPYFPESSTSAGSQSPGANSLLPTDSPPPYFSLFSHGRTSALENQDTAHEQEHEFVYTISGPHSPPEITHAPRVLLELPPRYEEKETPTATSLSLPSELSAP +>XP_004835810.1_PREDICTED:_nectin-3_isoform_X1 +MASAPLSPGGSKAQLSSASPLAAGLLLPAPTPTPLLLLLFPLLLLSRLCGALAGPIIVEPHITAVWGKNVSLKCLIEVNETITQISWEKIQGTSTQTVAVHHPQYGFSVQGEYQGRVSFKNYSLNDATITLHNIEFSDSGKYICKAVTFPLGNAQSSTTITVLVEPTVSLMKGLDSLIDGGNETVAAICTAATGKPVAHIDWEGDLGEKESSTVSFPNETATIISRYKLFPTRFARGRRITCVVKHPALEKDIRYSFVLDIQYAPEVSVTGYDGNWFVGRKGVNLKCNADANPPPFKSVWSRLDGQWPDGLLASDNTLHFVHPLTFNYSGVYVCKVTNSLGQRSDQKVIYISDPPTTTTLQPTIHWHPSTADIEDLATEPKKLPFPLSTLATIKDDTVGTIIASVVGGALFIVLVSVLAGIFCYRRRRTFRGDYFAKNYIPPSDMQKESQIDVLQQDELDSYPDSVKKENKNPVNNLIRKDYLEEPEKAQWNNIENLNRFERPVGYYEDLKMGMKFVSDEHYDENEDDLVSHVDGSVISRREWYV +>XP_004850235.1_PREDICTED:_receptor-binding_cancer_antigen_expressed_on_SiSo_cells +MAITQFRLFKVCTCLAAVFSFLKRLICRSGRGRKLSGDQITLPTTVDYSSVPKQTDVEEWTSWDEDAPTSVKIEGGDGSAATQQNALEQLEPDYFKDMTPTIRKTQKIVIKKREPLNFGNPDGSTGFSSRLAATQDMPFIHQSSELGDLDTWQENTNAWEEEEDAAWQAEEVLRQQKIADREKRAAEQQRKKMEKEAQRLMKKEQNKIGVKLS +>XP_012934280.1_PREDICTED:_cell_adhesion_molecule-related/down-regulated_by_oncogenes_isoform_X2 +MHPDLGPLQTLLYVILTILCSSVVSDLAPYFISEPLSTDQQLGGPVILHCSAKPLTAHISWLHNGKRLGRNVEQIKIHQGTLTILSLNPSLSGYYQCIANNSIGAILSGPATVSIAVLGDFDSSAKHVITAEEKSTGFIGCQVPASNPKAEVRYKIRGRWLKHSTGNYVILPSGNLQILNVSSEDKGVYKCAAYNPITNELKVEPVGQKLLVSRPSSDGFQILHPTLSQALAVLSHSPVTLECVVTGVPASQVYWLKEGQDAVLGSNWRRLYSHLATASIDPADSGNYSCVVGNKSGDIKHVTYMVNVLEHASISKGLQDQRVSLGATVHFTCDVLGNPVPNRTWFHNAQPIHPSPRHLTGGNELKITGVTMEDSGLYQCVADNRIGFMQSTGRLQIEQSNGFKPVIITAPTSAMVSDGDFVMLSCNATGVPVPVIRWYDSRGLITSHPSQVLRSKSRKSHLVRPGGLDPEPVYFIMSRAGSSSLSIQAVTQERAGRYICEAINDYGTTRSEAFLTVVPFETNTKAETLTPDAIQSDERDHRDSSESGLLSSFPGKGHPRAVESSEKNPSGTSVPDAPIILSPPQTHTADTYHLVWRAGKDGGLPINAYFVKYRKLDDGAGAVGSWHTVRVPGSENELQLTELEPSSLYEVLMVARSAAGEGQPAMLTFRTSKEKTASSKNTQASSPPLGIPKHPVVSEATNYNFGVVLTDSSRHSGVPEAPDRPTISTASETSVYVTWIPRANGGSPITAFKVEYKRMRTGDWLVAAEDIPPSKLSVEVRNLEPGSIYKFRVIAVNHYGESFRSSASRPYQVAGFPKRFSSRPITGPHIAYTEAVSDTQIMLKWTYIPSSNNNTPIQGFYIYYRPTDSDNDSDYKRDVVEGSKQWHMIGHLQPETSYDIKMQCFNEGGESEFSNVMICETKVKRVPGASEYPIKDLSTPPNSSGNGGNVGPATSPARSSDMLYLIVGCVLGVMVLILMVFIAMCLWKSRQQNAIQKYDPPRYLYQGSDINGQMVECATLPGTQINGSVHAGFLGNSSLNNGCAHLHHKVPNGVNGMVNGSLTGGLYPAHTNSLTRTHVEFEHPHHLVNGGGMYTAIPQIDPLECVNCRNCRNNNRAGKKKLREAEGDLLSGNCPGFWILASY +>XP_012931436.1_PREDICTED:_coiled-coil_domain-containing_protein_91_isoform_X4 +MPMWNKVSGVHLSPASPEQVLDHDHSSPSVGCLSPDAILSSPENAHTDNSIVSNAVPKAQVQQSTRTHLDIPLFPLGLSVETSDGTVALVDDSEDPAGNVSNIQLQQKVSDLEMKLKMSEEEKQRIKKDVESLMEKHSILEKDFLKEKEQEAISFQDRYKELQEKHKQELEDMRKMGHEALGIIVDEYKALLQSSLKQQVEAIEKQYISAIEKQAHKCEELLNAQHQRLLEMLDREKEMLKEKINEALNQQSQEQKEILKKCLEEERQKHKEALESSAKLEQEAMKEVVMKAIEEERKNLEKAHAEERELWKTEHAKDQENVSQAIETAIQEQRKISQETVKAAIIEEQKQSEKAVEEAVRRTRDELIEYIKEQKRLDQVIRQRSLSSLELFLSCAQKQLSALIATEPIDTE +>XP_004836942.2_PREDICTED:_kinesin_light_chain_1_isoform_X1 +MYDNMSTMVYIKEDKLEKLTQDEIISKTKQVIQGLEALKNEHNSILQSLLETLKCLKKDDESNLVEEKSSMIRKSLEMLELGLSEAQVMMALSNHLNAVESEKQKLRAQVRRLCQENQWLRDELANTQQKLQKSEQSVAQLEEEKKHLEFMNQLKKYDDDTSPSEDKDADSAREPLDDLFPNDEDDPGQGIQQQHSSAAAAAQQGGYEIPARLRTLHNLVIQYASQGRYEVAVPLCKQALEDLEKTSGHDHPDVATMLNILALVYRDQNKYKDAANLLNDALAIREKTLGKDHPAVAATLNNLAVLYGKRGKYKEAEPLCKRALEIREKVLGKDHPDVAKQLNNLALLCQNQGKYEEVEYYYQRALEIYQTKLGPDDPNVAKTKNNLASCYLKQGKFKQAETLYKEILTRAHEREFGSVDDENKPIWMHAEEREECKGKPKDGTSFGEYGGWYKACKVDSPTVTTTLKNLGALYRRQGKFEAAETLEEAAMRSRKQGLDTVHKQRVAEVLNDPESTEKRRSRESLSSDVVKYESGADGGEEVSMSVEWNGDGTGSLKRSGSFSKLRASIRRSSEKLVRKLKGGSSRESEPRNPGASPAEPLCVENDSSSLEDASTN +>XP_004839072.1_PREDICTED:_tudor_domain-containing_protein_1 +MMSRNLEASVCQMTEPNFEKDEVKLPSHDSLRTPGGHHNHPNFRLKSPENGNGNNFLLCEQTRQYLSRQEDNSVSSDAGGINGEVVGSKGNRKTGNSVSPLSVENNSSPREIKPKPTNNVPPVKSKKSHHFVKNSLSINNPALFNSLRLPFRSTTCHRCGLFGSLRCSQCKQTYYCSTACQRRDWSTHSIVCKPVQQNFHKFEENKSPFEMNVEVKNESNCPPGVTKEIAIAAEKIMFSDLKGLHLKKTMEIKGTVTEFKHPGDFYVQLYSSEALKHMNQLSASLKETYANMVHEEDYIPIKGEVCVAKYTVDQTWNRVMIQDVDELQKTAQVLYIDYGNKEIIPVNRIHQLNRNIELFPPSAIKCFVAGVTPAEGTWSDDCIKTIKSLLMEQYCSIKIVDILKEELVAYAVDVMLQSSGEFLDHMLVEMGYGLKAKGQNSKKQCTGQSDPADVGMMTAENKIAVDRSDLIPKVLTLNVGDEFCGVVAHIQTPEDFFCQQLQSGRKLAELQTSLSEYCGQVCPRSDFYPTIGDICCAQFSEDDQWYRASVLAYASEESVLVGYVDYGNFEILSLTRLCPIIPKLLELPMQALKCMLAGVKPSLGIWTPEAICLMKKIVQNKMVMVKVVDKLDSSYLVELRDKSVTPVISVAKVLIDAGFAVDEKETVTDKPSVPLSAEGKVNPVEWTWVELAVDQTVDVVVCTMYNPGEFYCHILKEHALEKLSDLNKSLAEYCRQKLHNGFKAEIGQPCCAFFADIQPKNKYWTKEAIARFQMCISGVKLQARVVEITERGVGVELTDLSTSYPRIISDVLISEKLVLKAGSPYKDLPDNRPVNKHNHETFTQGLQAFSSAEQWKTIELPANKTVQASILEIINPNLFYAIPNDMPENQEKLSILTAELLEYCSAQKSQPSCKPRIGDACCAKYTGDDFWYRAVVLETSGSDVKVLYADYGNIETLPLSRVQPITASHLELPFQIIKCSFEGLVELNGSCSQLIIELLKNFMLNQNVMLSVKEIIKNIHTVSVEKCSEHGTVSVPDKLVKYNRAQSITSKNQNALHKEKMHRMNCCCTELQEQVEKHEQILFFLLNNPTNQNKLIEMKKLLKS +>XP_004868449.1_PREDICTED:_RNA-binding_protein_44 +MMQATALVEMASGKGYHSSGENLQKDLSSDSKKSSNACNEVKLTFPDHEWDSLALEPRASVREISNTDTTRLLESSFSENQDTNIQSAHSQSSKFEDSIDYVFMNEIYCIYSESELKNENTTNLNSELDSEIEKREEAFFDILKLQGTRTVALERICEISNADYEETAGEMQKDVIEEDSQQEYHSAEEQEYISNHLSFVQAKTSSISNLEVELRNSGHEVQSASNLEDNPIKLESSSVISSDSLNVVAQEYTPCVSKFQNCDLLKEYYEPKYEKCKEQETSLMYPIVFVQRGNSLGNEESQAKNDFLNPQTALKTKTCTETMKSQISENKDFCGNAVVKNRISQHLENPSTISQDRALETLQESSKVCQTSWSSIFDDSVISAYGCSHYESLQSTPDPALGFAVPPRIAIRDDQTIKEDSSLKAINGNNMNKACSEEDGKGTYPKSVIDAAGCTVTVHQTVDVSTDFRACFTTSRATNARPSVVSTSSNTEVTMMSKKRPSKWQSGKQKSVACNTDWSYGQDGVDTPVAITKGSGKSLSVDSSQPNGNFQNKDSLELKTYDNTDLKKHPDREFQLSEEVEKSSPSQCCKKVMQRLMEAEMHLLNARYEMCRRHCWDIYKLTVENKGLNRNLLSSSAQKELGSALLSISGDLKVRYTNLKEKIHKGIPLEELPLLSVESKLLITFSTFVSRLMKEESHDFSGADSELNDQTASASEVSPSLKETHSQMSSLPDSTSPKKDGLKNGEINVDFSQLKLDDKECRSGHEVSEHWFDAKENMTGVDSSEIQETEIDHDRQNPKLTVEMKNVEPLQRDKGFLIHVGGLCPSVSEADLRSYFQKYQVSEISICDSSTDYRYASLSFKKNSDAKMAVEEMNGMEISGKSVNVWLIETHGECTSPLSSKKHLNNLEKNINKEINPASSVSRLARTRPRQMVSEQDSELSPLDQDAKKNCKQIESAQLPKIPIQFLPPNTLNFRSFTKIIKILAELHPEVSRHHIISALQEVRKNQKGFLKGLSISTIVEMTSSVLKKTASH +>XP_012933645.1_PREDICTED:_fas-binding_factor_1_isoform_X5 +MTLLWSGFTWPGQCCERAACSPQSPKMAPKIKKGLKGFIDDVLGDLLGDDTIIPEKPLEPVPLNRDATDVPQKLPSSKARGRSFREGEVFNTLGSLAGADAEASDISDADPQALLQAIKDLDDMDADLLGLKKSPASDKREAKGSGKEELPRNSKPADKLTASEKDLEDSSGRLLSDDEGRIARKAPVTESKTASNRNPSTVRGPGPSIPLTPGDTPIRRKEELLFDDGDDIMATLGFEDSPTAERRQMGDQEGPRPARSKLDELLGRGTATKLLARPGTGEHREFKLDKKYQRSQDEEDAWDDEILTFGVYQPTLGSSEGRQSRRQSVRFLAESGPDPKGEPGSKRSPPVASSPIQPRKGGADWLGLKDEDLDLLPPSSTQEAQGGDSAIFTPSVPPPVSQHLAPGLHSTPAGLHSSGTKLPAEGAVSPAKSNQAAKLGAAREEEEKEDWLSHILSQKKSQGLAREEHTGACETLNPVGTAGSALSASQPIASIQGLDQAAAGRTSGRATAQEALATRPDAAGSPTSCSQGPLALSAGDLKRRAVSGDPSHTEPTTRFPSSQEPTGLLVPVQSLVSQSLVQNLLPDMGYQKPLLVAQTQLQSSAAPLQTELLQCQARLAEMEAQVRKLELERAQHRLLLESLQQQHQADLELIESAHRPFRGCSLSRSRIKVLETSYQQREERLRRENEELSAQYLSHCQEAEQARTELTAQHQRRLAAAEQEKVQEMERLRELQQASIMEMRKDHEEQLQRLKLLKDREIDAVTSATSHTRSLNGIIEQMENFSSSLNELASRVEASHLTTSQERELGIRHRDEQLRVLKEQLGRQQRDMEEERGRLQEVIGKMEARLSEQSRLLEQERWRVTSEQSKAESMQRALEEQRKVMVQQITMEREELERAKSTLLEEQKSVMHKCGEERRRLAVEWAEFSTQQKLSKERADREVERALQVDTQREVTIISLAKEQAELKIRASELRAKEEQLATEREAVERERQELRLEKEKVKATALSLQLRVEEVEHMSKVASNKYEEGEQALHKARQLPPSLLSPLWGWGQEHLSLAQQRLQLDHVRQDLPCCLPELPPRAQGPAPSSLRAASTFVVPTSASNQHSQLLAGPCPTHLLTKLVLLKHSAEQDRDFLKNEEFFLEALKKAPYNLASN +>XP_012925593.1_PREDICTED:_nuclear_receptor-binding_protein_isoform_X1 +MSEGESQTVLSSGSDPKVESSSSAPGLTSVSPPVTSTTSAASPEEEEESEDESEILEESPCGRWQKRREEVNQRNVPGIDSAYLAMDTEEGVEVVWNEVQFSERKNYKLQEEKVRAVFDNLIQLEHLNIVKFHKYWADIKENKARVIFITEYMSSGSLKQFLKKTKKNHKTMNEKAWKRWCTQILSALSYLHSCDPPIIHGNLTCDTIFIQHNGLIKIGSVFHRIFANVAPDTINNHVKTCREEQKNLHFFAPEYGEVTNVTTAVDIYSFGMCALEMAVLEIQGNGESSYVPQEAISSAIQLLEDSLQREFIQKCLQPAPARRPTARELLFHPALFEVPSLKLLAAHCIVGHQHMIPENALEEITKNMDTSAVLAEIPAGPGREPVQTLYSQSPALELDKFLEDVRNGIYPLTAFGLPRPQQPQQEEVTSPVVPPSVKTPTPEPAEVETRKVVLMQCNIESVEEGVKHHLTLLLKLEDKLNRHLSCDLMPNENIPELAAELVQLGFINEADQSRLTSLLEETLNKFNFARNSTLNSAAVTVSS +>XP_012927835.1_PREDICTED:_sodium/hydrogen_exchanger_3_isoform_X1 +MSRHTGPLWAVLAALVLPRAGAIEEEPSGASQGFQIVTFKWHHVQDPYIIMLWILVASLAKIVFHLSHKVTRIVPESALLIMLGLVLGGIVWAADHIASFTLTPTVFFYYLLPPIVLDAGYFMPNRLFFGNLGTILLYAVIGTVWNAATTGLSLYGVFCSGLMGDLQSGLLDFLLFGSLIAAVDPVAVLAVFEEVHVNEVLFIIVFGESLLNDAVTVVLYSVFESFVTLGGDKVTGVDCVKGIVSFFVVSLGGTLVGVVFAFLLSLVTRFTKHVRIIEPGFVFVISYLSYLTSEMLSLSAILAITFCGICCQKYVKANISEQSATTVRYTMKMLASGAETIIFMFLGISAVDPLIWTWNTAFVLLTLLFISVYRTIGVILQTWILNRYRMVQLEPIDQVVMCYGGLRGAVAYALVVLLDKKKVKEKNLFVSTTLIVVFFTVIFQGLTIKPLVQWLKVKRSEQKEPKLNEKLHGRAFDHILSAIEDISGQIGHNYLRDKWSNFDRKVLSKVLMRRSAQKSRDRILNVFHELNLKDAISYVAEGERRGSLAFIRSPSTDNMVNVDFSTPRPSTVEASVSYLLRENVSAVCLDMQSLEQRRRSIRDTEDMVTHHTLQQYLYKPRQEYKHIYSRHKLTPNEAEKQDKEIFHRTMRKRLESFKSAKLGMNQNKKAAKLYKRERAQKRRNSSIPNGKLPMESLAHNFAIKEKEFELLDAEEAPDYEVEETSGGIEFLANVTKDTASDSPAGDTGSDTPLTRPSSPRRGPPAVLQPPHPAMSPPASPAQSSRMPGPGAHARSAAARRVHSRRSFQRPRARRRPELRKLASLQPPGPAELPPLALEQEETPL +>XP_004843644.1_PREDICTED:_zinc_finger_protein_70 +MEVSPATKFRETFVFEDRLETRQDLFQGEDLGDPFLQEKGLEQMAVIYKEIPLGEQDLECDDYEGNFSLCSSPVHPQSILPGVRPQDEEIFGQAFLKKPDISVCQIIHGEESSPQAHEEVARGHLGPNAPHRTPQPAKPYACRECGKAFSQSSHLLRHLVIHTGEKPYECCECGKAFSQSSHLLRHQIIHTGEKPYECRECGKAFRQSSALSQHQKIHTGKRPYECRECGKDFSRSSSLRKHERIHTGERPYQCKECGKSFNQSSGLSQHRKIHTLKKPHECDLCGKAFCHRSHLIRHQRIHTGKKPYKCEECGKAFSQSSNLIEHRKTHTGEKPYKCHKCGKAFSQSSSLIEHQRIHTGEKPYECCQCGKAFCHSSALIQHQRIHTGKKPYGCECGKAFRHRSALIEHYKTHTREKPYVCNLCGKSFRGSSHLIRHQKIHAGEKL +>XP_012933259.1_PREDICTED:_serine/threonine-protein_kinase_greatwall_isoform_X1 +MESAGSERERGGGAAAGPWAHAVPVPRPPSIEEFTIVKPISRGAFGKVYLGQKGGRLYAVKVVKKADMINKNMTHQLQAERDALALSKSPFIVHLYYSLQSASNVYLVMEYLIGGDVKSLLHIYGYFDEEMAVKYISEVALALDYLHRHGIIHRDLKPDNMLISNEGHIKLTDFGLSKVTLNRDINMMDILTTPSMAKPKQDYSRTPGQVLSLISSLRFFTPVAEKNQDSTDILSAHLSETSQLSQGLICPMSIDQKETTPYSSKLYSCLETLAPQPGVPMRCLTPGLLQSRRRLATSSTSSQSHTFVSSVESDCHSSPKWERDCQESDEASGSTMLSWNAMEKLCTKSANDLETQSFHKKDLEVALSPIHNSSAIPTTGEPCVNLAEKCSSGEVSWEARELEVDKVNLAPDPGQPRCQQSKQRALNSSSMPEEPLGKRSLKRNFELVESSPCQEIIQNKKNCVENKDSKGMRDCHANHSTGLTAEVRALNFSAFGCQQNHRANQENSVHCFAGKHTPENVPVPVIAKNLLCELDEDWEKTNKKECLSSNFLCCDDDSGPRSICMDSDSSFPGISVMESSLERQSLDPDKSIKESSFEESNIEAQLTVSPSYQQNALPKDDENSAVQDSNPKMLAPSEVWKTLTVSKRNAVAFRSFNSHINASSNSEPSRMSITSLDAMDISCAYSGSYPVAVTPTQKGRSSQPYQQTPNQTKSGTSYRTPKSVRRGAAPVDDGRVLGTPDYLAPELLLGTAHDIPWPEGEEKLSNNAQSAVEILLTIDDTKRAGMKELRHHPLFSDVDWENLQHQTMPFIPQPDNETDTSYFEARNNAQHLTISGFSL +>XP_004875104.1_PREDICTED:_uncharacterized_protein_LOC101699736 +MAKETRSNFLDLFFSLFLCKKKRFPLADEGKGPFNSSSLHGGGCQTRWGSLRCLPPATSRNKWSESAPFQANFFPVRLGPAGGRGVVPPPKRSTPRLGAGQEARSSQRTTFLVSVLTSLTPGRGPRRPAEEGGQRERRRGRGREGAAGGGVLGLSLPPPYFRHLTPSAKRAVPPRRRRQRFLLAGPGGSATAGRAPGPRATCRTHRASAGGPGRPARPGPAAPHPARSPRPAPAPAPRRRAPRSGHARTLRTSHAVTGSPQPASPRAPSGSLLPAPRRSCRCRCRSGWFTRLTLGEVWRCRLDVRRSASLSLPPAGGAQGELEVEQNKKAAYWMQKRKNYGLNFQLGNRLRMANRNMRTHCQLEVEAQVSLGDSRSFHVAVTTRPKPELPVTLVTVTGAGGLPFGAAACSEVTLWGYLLSLMGSNGGSLLSRLLSAEGKKLLLRRGESQEHNTVPVSQKHSLSSLV +>XP_012933192.1_PREDICTED:_retinoic_acid_receptor_alpha_isoform_X2 +MASNSSSCPTPGGGHLNGYPVPPYAFFFPPMLGGLSPPGTLTSLPHQLPVSGYSTPSPATIETQSSSSEEIVPSPPSPPPLPRIYKPCFVCQDKSSGYHYGVSACEGCKGFFRRSIQKNMVYTCHRDKNCIINKVTRNRCQYCRLQKCFEVGMSKESVRNDRNKKKKEAPKPESSESCTLTPEVGELIEKVRKAHQETFPALCQLGKYTTNNSSEQRVSLDIDLWDKFSELSTKCIIKTVEFAKQLPGFTTLSIADQITLLKAACLDILILRICTRYTPEQDTMTFSDGLTLNRTQMHNAGFGPLTDLVFAFANQLLPLEMDDAETGLLSAICLICGDRQDLEQPERVDLLQEPLLEALKVYVRKRRPSRPHMFPKMLMKITDLRSISAKGAERVITLKMEIPGSMPPLIQEMLENSEGLDTLSGQPGGGGREGGGLATATGSCSPSLSPASNRSSPATHSP +>XP_012922790.1_PREDICTED:_amiloride-sensitive_sodium_channel_subunit_alpha_isoform_X1 +MDSQGSMKGAELEAGGPSPPQPTQGLAKGDESEQPGLGPEPTAPQQCLEEEEALIEFHRSYRELFQFFCNNTTIHGAIRLVCSKHNRMKTAFWAVLWLCAFGMMYWQFGLLFGEYFSHPVSLSINLDSDKLVFPAVTVCTLNPSRYKEIKEQLRELDRITEQTLFDLYKYNASSTLLAGARGRRDLEETLLHPLQRIPVSPGPGRARSAASSLKDNNPQVDRKDWRIGFQLCNQDKSDCFYQTSSSGVDAVREWYRFHYINILARLADTSPSLEEEALGNFIFTCRFNQAPCTQANYSHFHHPIYGNCYTFNNKNDSSLWMSSMPGIHNGLSLTLRTEQNDYIPLLSTVTGARVTVHGQDEPAFMDDGGFNLRPGVETSISMRKEALHRLGGDYGDCTQDGSDVPVQNLYPSKYTQQVCIHSCFQESMVENCGCAYIFYPRPKGVEFCDYRNHSAWGYCYYKLQGAFSSDSLGCFNKCRKPCSVTNYKLSAGYSRWPSVASQDWIFQMLSLQNNYTINNKRNGVAKLNIFFKELNYKTNSESPSVTMVTLLSNLGSQWSLWFGSSVLSVVEMAELIFDLLVITFLLLLRRLRSRYWSPGRGAGPAREAACTPARFCPHPASPDLAAPPPAYATLSACPPPPGWACAPGQP +>XP_004865340.1_PREDICTED:_transmembrane_protein_168 +MCKSLRYCFSHCLYLAMTRLEEVNREVNMHSSVRYLGYLARINLLVAICLGLYVRWEKTANSLILVIFILGLFVLGIASILYYYFSMEAASLSLSNLWFGFLLGLLCFLDNSSFKNDVKEESTKYLLLTSIVLRLLCALVERISGYVRHRPTLLTTVEFLELVGFAIASTTMLVEKSLSVILLVVALAMLIIDLRMKSFLAIPNLVIFAVLLFFSSLETPKNPIAFACFFICLITDPFLDIYFSGLSVTERWKPFLYRGRICRRLSVVFSGLIELTFFILSAFKLRDTHLWYFVIPGFSIFGIFWMICHVIFLLTLWGFHTKLNDCHKVYFAHRADNNSLDRIMASKGMRHFCLISEQLVFFSLLATAIFGAVSWQPTNGIFLSMFLIVLPLESMAHGLFHELGNCLGGTSVGYAIVIPTNFCSPDGQPTLLPPEHVQELNLRSTGMLNAIQRFFAYHMIETYGCDYSTSGLSFDTLHSKLKAFLELRTVDGPRHDTYVLYYSGHTHGSGEWALAGGDILRLDTLLEWWREKNGSFCSRLIIILDTENSTPWVKEVRKVNDQYIAVQGAEMAKIVDIEEADPPQLGDFTKDWVEYNCNSSNNICWTEKGRTVKALYGVSKRWSDYTLHLPTGSDVAKHWMLHFPRITYPLVHLANWLCGLNLFWICKTCFRCLKRLKMRWFLPTVLDTGQGFKLVKS +>XP_004846012.1_PREDICTED:_ethylmalonyl-CoA_decarboxylase_isoform_X1 +MANSLLKTSSLSARTKLLHIQGVSLYNTTHGFQEEEVKKTLQQFPGGSVDLQKDNTGIGILTLNNPSKMNAFSGTMMLQLLEKVIELENWTEGKGLIVRGAKNTFSSGSDLNAVKALATGEVGMALCMFMQSTLTRLARLPLISVALVQGRALGGGAEFTTACDFRLMTPESEIRFVHKEMGIIPSWGGTSRLVEIIGSREALKVLGGALKLDPKKALNIGMVEEILQSSDEMKSLEEAQAWLTQFVNGPPEVIRALKKSVCSGKELYLEEALQNERDLLGTVWGGAANLQAIARRGKFNK +>XP_012929583.1_PREDICTED:_ectonucleotide_pyrophosphatase/phosphodiesterase_family_member_2_isoform_X4 +MDSAQQTALKQDSRATAEWQERREHDEIELRANQRSLSTSQVGLPRVTRLNSEPQAEQPASERKAAAGSGLSKNLGMAGGGAARPCQALSLFTFAVLCLGATVSRTKRAEEWDESSLSVLSDSPWTNVSGSCKGRCFELEEVGPPDCRCDNLCKSYSSCCQDFDELCLKTARGWECTKDRCGEARDEEHACHCSEDCLARGDCCTNYQVVCKGESHWVDDDCEELKAPECPAGFARPPLIIFSVDGFRASYMKKGSKVMPNIEKLRSCGTHSPYMRPVYPTKTFPNLYTLATGLYPESHGIVGNSMYDPVFDATFHLRGREKFNHRWWGGQPLWITAAKQGVRAGTFFWSVAIPHERRILTILQWLSLPDNERPSVYAFYSEQPDLSGHKYGPFGPEMTNPLRDIDKTMGQLMDGLKQLKLHRCVNVIFVGDHGMEDVTCERTEFLSNYLTNVDDITLVPGTLGRIRSKFSNNAKYDPKVIMANLTCKKPDQHFKPYLKQHLPKRLHYANNRRIEDIHLLVERRWHVASRKSLDVYRKSTGKCFFQGDHGFDNKVNSMQTVFVGYGPTFKYKTKVPPFENIELYNVMCDLLGLKPAPNNGTHGSLNHLLRSNIFRPAMPEEVTRPSYPGIMYLQSDFNLGCTCDDKNKLDELNKRPHTKGSTEAETRKFRSSKNENKENINGSFEPRKERHLLYGRPAVLYRTRYDVLYHTDFESGYSEISLMPLWTSYTVSKQAEVSLIPEHLASCVRPDVRISPGISQSCLAYKNDKQMSYGFLFPPYLSSSPEAKYDAFLVTNMVPMYPAFKRVWSYFQRVLVKKYASERNGVNVISGPIFDYDYDGLHDTEEKTTQYVEGSSIPVPTHYYSILTSCLDFTQPADKCDGPLSVSSFILPHRPDNDESCNSSEDESRWVEDLMKMHTARVRDIEQLTGLDFFRKTSRSYPEILALKTYLHTYESEI +>XP_004839490.2_PREDICTED:_neurexin-1-beta_isoform_X7 +MGAALLQRGGCALLCLALLLLGCWAELGSGLEFPGAEGQWTRFPKWNACCESELSFELKTRAARGLVLYFDDEGFCDFLELVLTRGGRLQLSFSIFCAEPATLLADTPLNDGAWHRVRLRRQFRNTTLLIDRVEARWVEVQSKRRDMTVFSGLFVGGLPPELRAAALKLTRASVREHAPFRGWIRDVRVDAARTLPEDGAEVRLDDDEPSGGGPCEVEEGAGGVCLNGGVCSVVDDRAVCDCSRTGFRGEDCSQGKEEYIATFKGSEYFCYDLSQNPIQSSSDEITLSFKTLQRNGLMLHTGKSADYVNLALKNGAVSLVINLGSGAFEALVEPVNGKFNDNAWHDVKVTRNLRQHSGIGHAMVNKLHCSVTISVDGILTTTGYTQEDYTMLGSDDFFYVGGSPSTADLPGSPVSNNFMGCLKEVVYKNNDVRLELSRLAKQGDPKMKIHGVVAFKCENVATLDPITFETPESFISLPKWNAKKTGSISFDFRTTEPNGLILFSHGKPRHQKDAKHPQMIKVDFFAIEMLDGHLYLLLDMGSGTIKIKALQKKVNDGEWYHVDFQRDGRSGTISVNTLRTPYTAPGESEILDLDDELYLGGLPENKAGLVFPTEVWTALLNYGYVGCIRDLFIDGQSKDIRQMAEVQSTAGVKPSCSRETAKPCLSNPCKNNGMCRDGWNRYVCDCSGTGYLGRSCEREATVLSYDGSMFMKIQLPVVMHTEAEDVSLRFRSQRAYGILMATTSRDSADTLRLELDAGRVKLTVNLDCIRINCNSSKGPETLFAGYNLNDNEWHTVRVVRRGKSLKLTVDDQQAMTGQMAGDHTRLEFHNIETGIITERRYLSSVPSNFIGHLQSLTFNGMAYIDLCKNGDIDYCELNARFGFRNIIADPVTFKTKSSYVALATLQAYTSMHLFFQFKTTSLDGLILYNSGDGNDFIVVELVKGYLHYVFDLGNGANLIKGSSNKPLNDNQWHNVMISRDTSNLHTVKIDTKITTQITAGARNLDLKSDLYIGGVAKETYKSLPKLVHAKEGFQGCLASVDLNGRLPDLISDALFCNGQIERGCEVALMKADLQGPSTTCQEDSCSNQGVCLQQWDGFSCDCSMTSFSGPLCNDPGTTYIFSKGGGQITYKWPPNDRPSTRADRLAIGFSTVQKEAVLVRVDSSSGLGDYLELHIHQGKIGVKFNVGTDDIAIEESNAIINDGKYHVVRFTRSGGNATLQVDSWPVIERYPAGNNDNERLAIARQRIPYRLGRVVDEWLLDKGRQLTIFNSQATIIIGGKEQGQPFQGQLSGLYYNGLKVLNMAAENDANIAIVGNVRLVGEVPSSMTTESTATAMQSEMSTSIMETTTTLATSTARRGRPPTKEPVSQTTDDILVASAECPSDDEDIDPCEPSSGGLANPTRVGGREPYPGSAEVIRESSSTTGMVVGIVAAAALCILILLYAMYKYRNRDEGSYHVDESRNYISNSAQSNGAVVKEKQPSSAKSANKNKKNKDKEYYV +>XP_004840752.1_PREDICTED:_vasopressin-neurophysin_2-copeptin +MPDTMLPACFLGLLAFTSACYFQNCPRGGKRAVTDTELRQCLPCGPGGQGRCFGPSICCADALGCFVGTAEALRCQEENYLPSPCQSGQKPCGSGGRCAANGVCCSPESCVIQPECREGFHRLARAGDRSNATQLDGPAGTLLLRLVQLAGLPDPKPATPGGY +>XP_012934276.1_PREDICTED:_zinc_finger_and_BTB_domain-containing_protein_44_isoform_X3 +MGVKTFTHSSSSHSQEMLGKLNMLRNDGHFCDITIRVQDKIFRAHKVVLAACSDFFRTKLVGQAEDENKSVLDLHHVTVTGFIPLLEYAYTATLSINTENIIDVLAAASYMQMFSVASTCSEFMKSSILWNTPNSQPEKSIDAGQENSNCNFTSRDGSISPVSSECSVVERTIPVCRESRRKRKSYIVMSPESPVKCSTQTSSPQVLNSSASYTENRNQPVDSSLAFPWTFPFGIDRRIQSEKTKQAENTRALELPGPSEAGRRMTDCVTCESTKASLPLGTEEDIRVKVERLSDEEVHEEVSQPVSASQSSLSDQQTVPGSEQVQEDLLISPQSSSIGSVDEGVTEGLPTLQNTSSTNVHVDDDDRTERPSPNGPDRPFQCPTCGVRFTRIQNLKQHMLIHSGIKPFQCDRCGKKFTRAYSLKMHRLKHEVIS +>XP_004857271.1_PREDICTED:_sedoheptulokinase +MLSVAKSVALETDSRSPSQKSSLRVRRLTGLRAALVAANMAVESVTLGIDLGTTSVKAALLEAAPGQPSGFMVLASCARTSRADAESNVAVPQGREQDVSRIIRALNECLAALPQKQLQKVGAIGVSGQMHGVVLWKTGQGCEWMQGGSASMFEARAVSHLVTWQDGRCSSEFLGSLPQPSSHLSVATGFGCATIFWLLKNSPELLQSYNAAGTIQDYVVAMLCGLRRPLMSDQNAASWGYFNTQSQSWNLEILRSSGFPVHLLPDIAQPGSAAGRTSHMWFEIPKGTQVGVAMGDLQASVYSCMGQKTDAVLNISTSVQLAASMPSGFQPTQTPDPASPVAYFPYFDRTYLGVAASLNGGNVLATFVHMLIQWMADLGQQSRPRETMAVTCRGHLEGLKVK +>XP_004873239.1_PREDICTED:_kinesin_light_chain_3_isoform_X2 +MSVQVAAPGGAGLGPERLPPEELVRQTRQVVQGLEALRAEHHSLAGHLGEALAGQGPVAGLELLEEKQQVVSHSLEAIELGLGEAQVLLALSAHVGSLEAEKQRLRAQARRLVQENTWLREELQETRQRLWASEAAVAQLEEEKSHLQFLGQLRQYDPPEESQRPDSPPRRDSLASLFPSEEEEHKGPEAAGVAAAQQGGYEIPARLRTLHNLVIQYAGQHRYEVAVPLCRQALEDLERSSGHCHPDVATMLNILALVYRDQNKYKEATDLLHDALQIREQTLGPEHPAVAATLNNLAVLYGKRGRYREAEPLCQRALEIREKVLGADHPDVAKQLNNLALLCQNQGKFEDVERHYARALSIYEALGGPNDPNVAKTKNNLASAYLKQSKYQQAEELYKEILRPEDLHSPLGAPGTGTAGDMKQQALPRSSSFSKLRESIRRGSEKLVSRLRGEGLAGAAGMKRALSLNVLNMDGQRALGTQLPSRPLGEASRTFSASTQDLSPH +>XP_004856751.2_PREDICTED:_myelin_protein_zero-like_protein_3_isoform_X3 +MLQSRCTWGVHIVISLEINADTHVRGYVGEKIKLRCMFKSTSHVTDKLTIDWTYRPPSSSRTESIFHYQSFQYPTTAGTFRDRISWAGNVYKGDASISISNPTLKDNGTFSCAVKNPPDVHHNIPLTELTVTERGFGTMLSSVALLSILVFIPSAVVVILLLLRMGRKAAGLKKRSKSGYKKSSIEVSDDTDQEEKDECMARLCVRCAECLDSDYEETY +>XP_004841024.1_PREDICTED:_cathepsin_Z +MAGRGPLGPLLLLWLLAGAARAALYFRRGQTCYRPLRGDQLSQSGRRTYPRPHEYLSLSDLPKTWDWRSVDGVNYASVTRNQHIPQYCGSCWAHGSTSAMADRINIKRKGAWPSTLLSVQHVIDCGGAGSCEGGSDLLVWKYAQEHGIPDETCNNYQAKDQECDKFNQCGTCTEFKECHTIQNYTLWRVGDYGSLSGREKMMAEIYKNGPISCGIMATEKMANYTGGIYAEYHEDAFINHVISVVGWGVSSDRTEYWIVRNSWGEPWGERGWMRIVTSTYKDGKGASYNLAIEESCAFGDPII +>XP_012923888.1_PREDICTED:_armadillo_repeat-containing_X-linked_protein_3 +MGYARKVGWVTAGLVIGASACYCIYRLTRGRKYNKEKMAEGGSGDVDDAGDCSGARYNDWSDDDDDGNDSKSIVWYPPWARIGTEAGTRARARARARATRARRAVQKRASPNSDDTILSPQELQKVLCLVEMSEKPYILEAALIALGNNAAYAFNRDIIRDLGGLPIVAKILNTRDPIVKEKALIVLNNLSVNAENQRRLKIYMNQVCDDTITSRLNSSVQLAGLRLLTNMTVTNEYQHMLANSISDFFRLFSAGNEETKLQVLKLLLNLAENPAMTRELLRAQVPLSLGSLFNKKENKEVILKLLVVFENLSDNFRWEENEPTQNQFGEGSLFFFLKEFQVCADKVLGIESHHDFLVKVKVGKFMAKLAENMFPKIQE +>XP_004839941.1_PREDICTED:_uncharacterized_protein_LOC101709220_isoform_X1 +MPLSGPSLCWAFLPPCLFLWKLESICALQVQLGGFGQPWRGSHTALEQDHLSQPAPQHPGPSSSEDESTPRVAGRPPWKMPTRHSTPEGKETALHWSPRPRGQASHLQESLTSARSAQDLVSHPGGLSPGATFRKRRLSTIYALEEGPSEQSGPCSEASVLEDDLPVPASLARPQEKAEDPQAKSWPRSPGLPGVPNTARKKRRDPKEWAAVMLRVRQWEARLLQDIEAAVHHELTIQDEGAPDIGMIQVEIQEPTTSG +>XP_004835491.1_PREDICTED:_COP9_signalosome_complex_subunit_2_isoform_X1 +MSDMEDDFMCDDEEDYDLEYSEDSNSEPNVDLENQYYNSKALKEDDPKAALSSFQKVLELEGEKGEWGFKALKQMIKINFKLTNFPEMMNRYKQLLTYIRSAVTRNYSEKSINSILDYISTSKQNSDFLCQMDLLQEFYETTLEALKDAKNDRLWFKTNTKLGKLYLEREEYGKLQKILRQLHQSCQTDDGEDDLKKGTQLLEIYALEIQMYTAQKNNKKLKALYEQSLHIKSAIPHPLIMGVIRECGGKMHLREGEFEKAHTDFFEAFKNYDESGSPRRTTCLKYLVLANMLMKSGINPFDSQEAKPYKNDPEILAMTNLVSAYQNNDITEFEKILKTNHSNIMDDPFIREHIEELLRNIRTQVLIKLIKPYTRIHIPFISKELNIDVADVESLLVQCILDNTIHGRIDQVNQLLELDHQKRGGARYSALDKWTNQLNSLNQAVVSKLA +>XP_004853463.1_PREDICTED:_rab_GTPase-activating_protein_1-like_isoform_X5 +MVENGSWSMTFEERENRRLQEASMRLEQENDDLAHELVTSKIALRNDLDQAEDKADVLNKELLLTKQRLVETEEEKRKQEEETAQLKEVFRKQLEKAEYEIKKTTAIIAEYKQICSQLSTRLEKQQAASKEELEVVKGKMMACKHCSDIFSKEGALKLAAISREDQGIEADDEKDSLKKQLREMELELAQTKLQLVEAKCKIQEIEHQRGALMNEIQAAKNSWFSKTLNSIKTATGTQPLQPPQAPQPPKEST +>XP_012930843.1_PREDICTED:_SUN_domain-containing_ossification_factor_isoform_X1 +MKKYRRALALVSCLSLCSLVWLPSWHVCCKESSSASATSYYSQGDNCALENEGVQLQKKDERKGPINAELPGKPSSDLPNPPEENKLKDDHIVDVRNAESEELRQSVIETLPTVDLHEDSSSVVMSNENVENTSSLSTSEITPVAKLDEIEKSSTIPIAKSSETEQSETDCDVGDASVQQPSFVSPPESLVGQHIENVSSSHGKGKITKSEFESKVSANEQGDDSPKSALNASDNLKNESSDFIKPGETDPTPPANPKDPEDIPTFDEWKKKVMEVEKEKSQSLHPSSNGGPHAAKKVQKNRNNYASVECGAKILAANPEAKSTSAILIENMDLYMLNPCSTKIWFVIELCEPIQVKQLDIANYELFSSTPKDFLVSISDRYPTNKWIKLGTFHGRDERNVQSFPLDEQMYAKYVKMFIKYIKVELVSHFGSEHFCPLSLIRVFGTSMVEEYEEIADSQYQSERQELFDEDYDYPLDYNTVEDKSSKNLLGSATNAILNMVNIAANILGAKTEDLTEGNKSLSENATATTAPTMPESTPVSTPVPSPEDVTTEVRATEPSTPDTPKDSPIVQLVQEEEEEASPSTVTLLGSGEQEDESSPWFELETQIFCSELTTICCISSFSEYIYQWCSVRIAFYRQRSRAAVSKGKDCRVSAQPSILLPAQSVDVSVLQPPSGELDSKNMERESETVILDDLSNAHHGDLINHTVEVIELEPSLFQTLSQSLLLDITPEINSLSKIEGSESVKHETGHTPSQVITQESSVEFDNETEKKFESFSSTEKLSMIYETNQVNEVTDNTVKEDVTSIEIITKLSETVVPPINTAIVSDSDSGEAKMNIAHTPKHIVTPAVDSSLPEVKEDEQSPEDALLRGLQRTATDFYAELQNSTDLGYANGNLIHGSNQKESVFMRLNNRIKALEVNMSLSGRYLEELSQRYRKQMEEMQKAFNKTIVKLQNTSRIAEEQDQRQTEAIQLLQAQLTNMTQLVSNLSTTVAELKQEVSDRQSYLVIALVLCVVLGLMLCMQRCRNTSQFDGDYISKLRKSNQYLSPKRCFSSYDDMNLKRRTSFPLIRSKSLQLTDKEVDPNDLYIVEPLKFSPEKKKKRCKYKTEKIETIKPADPLHPIANGDIKGRKPFTNQRDFSNMGEVYHSSYKGPPSEGSSETSSQSEESYFCGISACTSLCNGQSQKTKTEKRALKRRRSKVQDQGKLLKTLIQTKSGSLPSLHDIIKGNKEITVGTFGVTAVSGHI +>XP_004854264.1_PREDICTED:_prokineticin-2_isoform_X2 +MRSPRCAQVLLLLLLPPLLLSPWAGDAAVITGACDKDPQCGRGMCCAVSIWVKSIRICTPMGKVGDSCHPQTRKVPFFGRRMHHTCPCMPGLACLRTSFKQFICLARK +>XP_012930368.1_PREDICTED:_fermitin_family_homolog_3 +MAGMKTATGDYIDSSWELRVFVGEEDPEAESVTLRVTGESHIGGVLLKIVEEINRKQDWSDHAIWWEQKRQWLLQTHWTLDKYGILADARLFFGPQHRPVTLRLPNRRTLCLRASFSKPLFKAVADICRLLSIRHPEELSLLRAPEKKEKKKKEKEPEEEVFDLTKVVLAGGVAPVLFRGMPAHFSDSEHTEACFRMLSRPGPSPDPGLLQRLPRPGSLADKTQLHSRWLDSSRCLMQQGVKAGDILWLRFKYYSFFDLDPKADPVRLTQLYEQARWDLLLEEIDCTEEEMMVFAALQYHINKLTQSGEAGEVASMDPGLDDLDAALNNLEVKLEGSAPTDVLDSLTTIPELKDHLRIFRPRKLTLKGYRQHWVVFKETTLSYYKSQDEAPGDPIQQLNLKGCEVVPDVNVSSQKFCIKLLVPSPEGMSEIYLRCQDEQQYAHWMAGCRLASKGRTMADSSYTSEVQAILAFLSLQRAGGGGSGNHTQGPDASGEGLNPYGLVAPRFQRKFKAKQLTPRILEAHQNVAQLSLTEGQLRFIQAWQSLPDFGISYFMVRFKGSKKDEILGIANNRLIRIDLAVGDVVKTWRFSNMRQWNVNWDIRQVAIEFDEHINVAFGCVSASCRIVHEYIGGYIFLSTRERARGEELDEDLFLQLTGGHEAF +>XP_004834022.1_PREDICTED:_solute_carrier_family_26_member_6_isoform_X2 +MELQKRDYLVERPLLNQEQLEHLGHWGPTPRTHQWRTWFQCSHSRAHGYLLKYLPVLGWLPHYRVREWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYPVFVYFLFGTSRHISVGTFAIMSVMVGSVTESITQDEDFQQNTNSTVSARVQLASTLSVLVGLFQVALGLVHFGFVVNYLSEPLVRSYTTAASVQVFVSQLKYVFGLQLSSRSGPLSLIYTFLEVCWNLPKSVVGTVVTAVVAGVALVMVKILNDKLHRHLPLPIPGELLTLIAATGISYGVNLRNRFEVDTVGTIPTGLIAPMIPNPQLFGKLVGHAFAIAVVGFAIAISLGKIFALRHGYRVDSNQELVALGLSNFVGGFFQCFPVSCSMSRSLVQETTGGNTQVAGAVSSLFILLIILKLGELFRELPKAVLAAIIIVNLKGMLKQFTDICTLWKANRVDLLIWVVTFVATILLNLDLGLAVAIGFSLLLVVVRTQMPRYSVLGQVPDTDIYRDVAEYSEAKEIPGVKVFRSSATLYFANAELYSDTLKQRCGVDVDRLLAQKKKRLRKQERKLKQQQKHKQAASSNGTSVSISVDTSLGDIKGSGVEDSRVKVSPANELEDVVVSRQEDAKAPDVSTLKALGLPRPDFHSLILDLGALSFVDTVCIKSLKNIFRDFREIEVEVYIAACHSPVVTQLEAGCFFDASITKKHLFVSVHDAVTFALQHSRSGPNSPVLATKL +>XP_004871584.2_PREDICTED:_LOW_QUALITY_PROTEIN:_interleukin-20_receptor_subunit_alpha +MKNVLHWNPPESLQGVEVMYAVQYFIYGQKRWLNKPECKNISRTYCDLSDETSDYEHQYYAKVKAIWETNCSKWTEMGRFYPFLETQTGPPKVALTTDEKSISIVLTAPDKWKRNPEDCTISMQQIYSNLKYIVSVYNIKSKRTWSQFVTSPTLVLSCLEPNTLYCVQVESFVPEPPRPAQPSQKQCISTSEDPTSALKVKIILWYVLPTSVIVFLFSVIGYSIYRYIHVGKEKHPDNLILIYGNELDKRVFVPAEKIMINFITLNVLDDSKIPQKDMIRLDKSSDGSKLRDPKPLWNLESPPEEVEVKHLEYTPHLVGIFCNSEENTRATSLTKQESLTSTTAAGEAVVEYXCDVRTDIHGGSEDHQFSTQEGASIQGKLFQQQAALASLGPPMLCSYRPQLSDLHHLAQERSASEEGLEEESSTTLVDWDPRTGKLCIPSLSSFDQDPEGSEHSESDGLTEEGLLSRLYKEQVPAKTEEDENYVLQFTEEWGLYVPMES +>XP_004873235.1_PREDICTED:_kinesin_light_chain_3_isoform_X1 +MSVQVAAPGGAGLGPERLPPEELVRQTRQVVQGLEALRAEHHSLAGHLGEALAGQGPVAGLELLEEKQQVVSHSLEAIELGLGEAQVLLALSAHVGSLEAEKQRLRAQARRLVQENTWLREELQETRQRLWASEAAVAQLEEEKSHLQFLGQLRQYDPPEESQRPDSPPRRDSLASLFPSEEEEHKGPEAAGVAAAQQGGYEIPARLRTLHNLVIQYAGQHRYEVAVPLCRQALEDLERSSGHCHPDVATMLNILALVYRDQNKYKEATDLLHDALQIREQTLGPEHPAVAATLNNLAVLYGKRGRYREAEPLCQRALEIREKVLGADHPDVAKQLNNLALLCQNQGKFEDVERHYARALSIYEALGGPNDPNVAKTKNNLASAYLKQSKYQQAEELYKEILRPEDLHSPLGEPHPPCRLPGASALCPPLTSPSVPPGAPGTGTAGDMKQQALPRSSSFSKLRESIRRGSEKLVSRLRGEGLAGAAGMKRALSLNVLNMDGQRALGTQLPSRPLGEASRTFSASTQDLSPH +>XP_004835325.1_PREDICTED:_SET_domain-containing_protein_5_isoform_X1 +MEVLRDPIKKNSSESKPAQSGFSRGNSPLSCPESVEASPAVNEKSVYSTHNYGTTQRHGCRGLPYADHNYGAPPPPTPPASPPVQTIIPRSDLNGLPSPVEERCGDSPNSEGETVPTWCPCGLSQDGFLLNCDKCRGMSRGKVIRLHRRKQDNISGGDSSATESWDEELSPSTVLYTATQHTPTSITLTVRRTKPKKRKKSPEKGRAAPKTKKIKAFREGSRKSLRMKNSPSEAQNLDENTTEGWENRIRLWTDQYEEAFTNQYSADVQNALEQHLHSSKEFVGKPAILDTINKTELACNNTVIGSQMQLQLGRVTRVQKHRKILRAARDLALDTLIIEYRGKVMLRQQFEVNGHFFKKPYPFVLFYSKFNGVEMCVDARTFGNDARFIRRSCTPNAEVRHMIADGMIHLCIYAVSAITKDAEVTIAFDYEYSNCNYKVDCACHKGNRNCPIQKRNPNATELPLPPPPNLPTIGAETRRRKARRKELEMEQQNEATEENNDQQPQEVPEKVNASSDHQEVDNPDEKPEEEKEEVTEDLENPAHSRRTREDKKVEAIIHAFENLEKRKKRRDQPLEQSTPDIEITTTTSETPVGEETKTESPESEVSNTASNISIPSTPQNIGVNTRRSSQAGDVAVEKPLPKAPPAKPSRPRPKSRISRYRTSSAQRLKRQKQANAQQAELSQAALEEGGNNNSAAPTEAGILDSSGENRQLTGSDLTLLSVPGSHVNRAASKYPKTKKYLVTEWLNDKAEKQECPVECPLRITTDPTVLATTLNMLPGLIHSPLICTTPKHYIRFGSPFMPERRRRPLLSDGTFSSCKKRWIKQALEEGMTQTSSVPQETRTQHLYQSNENSNSSSICKDNADLLSPLKKWKSRYLMEQNVTKLLQPLSPVTPPPPGSGSKSPQLTTPGHTHPEEECRNGYSLMFSPIASLTTASRCNTPLQFENISSPESSPAHRPESLSPELCHRKDLDLTKVGYLDSNTNSCTDKPSLLNSGPSDLAPHPSIGPASETGFPNRSGDGHQTLMRNSDQAFRTEFNLMYAYSPLNAMPRADGLYRGSPLVGDRKPLHLDGGYCSPAEGFPSRYEHGFMKDLARGSMSPGGERACEGVPSAPQNPPQRKKVSLLEYRKRKQEAKENSAGGGGDSAQNKSKSAGAGQGSSNSVSDTGAHGMQGSSARTPSSPHRKFSPSHSSVSHLEAVSPSDSRGTSSSHCRPQENISSRWMVPTSVERLREGGSIPKVLRSSVRVAQKGEPSPTWESNSTEKDSDPADGECPDTLSSALSKGATVYSPSRYSYQLLQCDSPRTESQILLQQSSSPFRGHPTQSPGYSYRTTALRPGNPPSHSSSESSLSSASFPSPAHPASTDSLAPFTGTPGYYSSQPHSGNSTGSSLPRKSCHSSAASPTLQGPSDSPTSDSVSQSSTGTLSSTSFPQNSRSSLPSDLRTISLPSAGQSAAYQASRVSAVSNSQHYPHRGSGSVHQYRLQPLQGSGVKTQTGLS +>XP_004859328.1_PREDICTED:_MAGUK_p55_subfamily_member_3_isoform_X1 +MPVLSEDSGLHETLALLTSQLSPDSSHREEVGFLRDVFSERSLSYLMKIHEMLRCYEQQSPSPVLHSAVALAEDVVEELQAASAQAHSDERELLQLLATPHLRAMLMVHDTVAQKSFDPVLPPLPDNIDEDFEEESVKIVRLVKSKEPLGATIRRDEHTGAVVVARIMRGGAADRSGLVHVGDELREVNGVAVLHKRPDEISQILAQAQGSITLKIIPATQEGDRFKESKVFMRALFHYDPREDRAIPCQEAGLPFQRGQVLEVVSQDDPTWWQATRVGDTNLRAGLIPSKQFQERRLSHRRAAGTLPSPPSLRKPPYDHPCDSETCDHDGHLKGHYVAGLRRSFRLGCRERPAGLQDGKAPAGCEALELPTYEEVARYQPQPGERPRLAVLIGSLGARLQELKQKVVAENPQHFSVAVPHTTRPRRGQEKEGVEYHFVSRQAFEADLQHNRFLEHGEYKDHLYGTSLGAVRAVVAKNKVCVVDVEPEALKQLRTSEFRPYVIFVKPVVQEKRKTPPLSPAWEDTSGPLDEEQQDMAASAAYVEQHYGHLVDAVLVREDLQGACLQLRALLERLGTDAQWVPVSWVR +>XP_004845215.1_PREDICTED:_non-canonical_poly(A)_RNA_polymerase_PAPD7_isoform_X1 +MSPRPEEAAMRREVVQRIETVVKDLWPTADVQIFGSFSTGLYLPTSDIDLVVFGEWERPPLQLLEQALRKHSVAEPCSIKVLDKATVPIIKLTDQETEVKVDISFNMETGVRAAEFIKNYMKEYSLLPYLILVLKQFLLQRDLNEVFTGGISSYSLILMAISFLQLHPRIDARRADENLGMLLVEFFELYGRNFNYLKTGIRIKEGGAYIAKEEIMKAMTSGYRPSMLCIEDPLLPGNDVGRSSYGAMQVKQVFDYAYIVLSHAVSPLARSYPNRDSESTLGRIIKVTQEVIDYRRWIKEKWGSRVHPLPDLDNRIKMKERLSMCNGEQTPGREPRSPYSPRLALSLCSPQPLSSGSSASSVSSLSGSDVDSDTPPCTTPSVYQFSLQAPAALVGSLPAALPMPSAKPQATPSRTLIMTPNNQTRFAMPAPTLGVAPVPCRQAGVERTASSKAGHHMPAPAVPAAPPNPLCSPHLYHKQHNGMKLSMKGSHGHAQGGGYGSVGSGGVRPPMGNRGHHQYNRTGWRRKKHTHTRDSLPVSLSR +>XP_012921440.1_PREDICTED:_cdc42-interacting_protein_4_isoform_X1 +MDWGTELWDQFEVLERHTQWGLDLLDRYVKFVKERTEVEQAYAKQLRSLVKKYLPKRPTKDDPESKFSQQQSFVQLLQEVNDFAGQRELVAENLSVRVCLELAKYSQEMKQERKMHFQEGRRAQQQLENGFKQLESSKRKFERDCREAEKATQTAERLDQDINATKADVEKAKQQAHLRSHMAEESKNEYAAQLQRFNRDQAHFYFSQMPQIFDKLQDMDERRTTRLGTGYGLLSGAELQVVPIIAKCLEGMKVAADAVDAKNDSQVLIELHKSGFARPSDVEFEDFSQPMNRAPSDSSLGTPSDGRPEVRGTGRSRAKRWPFSKKNKAVVTEDFSHLPPEQQRKRLQQQLEERNRELQKEVDQSAGNGILDLVEALKKMKDVYEKTPQMGDPASLEPQITETLRNIERLKLEVQKYEAWLAEAESRVLSNRGDSLNRHTRPPDPPASAPPDSSSNSNSGSQENKESSSEEPPSEDGQDTPIYTEFDEDFEEPTSPIGQCVAIYHFEGSSEGTISMAEGEDLSLMEEDKGDGWTRVRRKQGGEGYVPTSYLRVMLN +>XP_012927342.1_PREDICTED:_activated_CDC42_kinase_1_isoform_X4 +MPAARRFPGLELSFPLLARLRRRLYTRLGSSSMQPEEGTAWLLELLSEVQLQQYFLRLRDDLNVTRLSHFEYVKNEDLEKIGMGRPGQRRLWEAVKRRKALCKRKSWMSKVFSGKRLEAEFPPHHSQSTFRKPSPTPGAPAGEGPLQSLTCLIGEKDLRLLEKLGDGSFGVVRRGEWDSPSGKTVSVAVKCLKPDVLSQPEAMDDFIREVNAMHSLDHRNLIRLYGVVLTPPMKMVTELAPLGSLLDRLRKHQGHFLLGTLSRYAVQVAEGMGYLESKRFIHRDLAARNLLLATRDLVKIGDFGLMRALPQNDDHYVMQEHRKVPFAWCAPESLKTRTFSHASDTWMFGVTLWEMFTYGQEPWIGLNGSQILHKIDKEGERLPRPEDCPQDIYNVMVQCWAHKPEDRPTFVALRDFLLEAQPTDMRALQDFEEPDKLHIQMNDVITVIEGRAENYWWRGQNTRTLCVGPFPRNVVTSVAGLSAQDISQPLQNSFIHTGHGDSDPRHCWGFPDRIDELYLGNPMDPPDLLSVELSTSRPSQHLGRLKREPPPRPPQPAIFTPKPTYDPVSEDPDALASDFKRLGLRKPGLPWGLWLSKPSARVPGTKAGRGVSGGASEVTLIDFGEDPVVPAPRPCAPSLAQLAMDACSLLDKTPPQSPTRALPRPLHPTPVVDWDARPLPPPPAYDDVAQDEDDFEVCSINSTLVGTGLATGPCQGETNYAFMPEPERCPLALEDNLFLPSQGGAPPPSSAQTAQIFQALQQECMRQLQVPTGSLAPSPGPASDDKPQVPPRVPIPPRPTHPRVELSPAPSGEEELGRWPGPVSPPRVPPREPLSPQSSRTPSPLVPPGSSPLPPRLSSSPGKTMPTTQSFASDPKYATPQVIQAPGPRAGPCILPIVRDGRKVSSTHYYLLPERPPYLERYQRFLREASSPEEPALQPVPLLPPPPSTPAPAAPTATVRPMPQAAPDPKANFSTNNSNPAVRPPTSQRGCPGDGLETARQADEVQMLQAMVHGVTTEECQAALQCHGWSMQRAAQYLKVEQLFGLGLRPRLECHKVLEMFDWNLEQAGCHLLGSFGPAHHKR +>XP_004867815.1_PREDICTED:_pulmonary_surfactant-associated_protein_A +MLLCSLAFTLILMAVSGIMCNRTEYCVGSPGIPGTPGSHGLPGRDGRDGVKGEPGPPGPMGPPGGMPGFPGCNGMSGIPGVPGERGDKGDPGERGPPGLPASLDEQIQTILHDFKHKILQSTGVLILQGSMMAVGDKVFATNGQSVDFNAIKETCVRAGGDIAAPRSPEENAAIASIVKKHNTYTYLGLMEGHTIGDFRYLDGAPVNYTNWYPGEPRGWGKEKCVEMYSDGTWNDRNCVQYRLAICEF +>XP_004845537.1_PREDICTED:_NADH_dehydrogenase_[ubiquinone]_1_alpha_subcomplex_subunit_6 +MAASGLRSGAAVASTAVKPIFSRDMNEAKRRVRELYRAWYREVPHTVSLFQLDITVKQGRDKVREMFMKNAHITDPRVADLLVIKGKMELEETINVWKQRTHVMRFFQETEAPRPKDFLSKFYAGHDP +>XP_012929452.1_PREDICTED:_aprataxin_and_PNK-like_factor_isoform_X1 +MSGGFELQPQDGGPRVALASGETVIGRGPLLGITDKRISRRHAILEVVGGQLRIKPIHTNPCFYRSSENSQLLPMKINLWHWLNPGDSFSLLADKYIFCVVSTHSEMEIECTLRNSQMLDEDDILNEVPKSPVINLPDKTARTSHLERTTEITETQTTSTSSVVRNPFLGECGGLSKQQSDPGQRKRSLPAWMLEDLSDQNLLAPVISGDNSIIQGSGREGICKEKTHINVTQQGRKRISSGNSESVSGGQDAGKKCKDTNQEESVISSKEMPESFSATTLSNPDMHTTKIKTQRNEIPIVGLAKVSKHKIMTKGTLTKGDEALSCSESCSSIQGKSFLSESQRSHPKSNSEASSSDTLHAKETDSLPRSSQENKVKRSSCMYGANCYRKNPVHFQHFSHPGDSDYGGMHVTGQDETDDRPECPYGASCYRKNLQHKIEYRHSILQVRSVSDEDDAVGQPNEYDLNDSFLDDEEEEYELTDEDSDWEPGKEDQEQEDVEELLKEAKKFMKRKK +>XP_004856579.1_PREDICTED:_radixin_isoform_X1 +MPKPINVRVTTMDAELEFAIQPNTTGKQLFDQVVKTVGLREVWFFGLQYVDSKGYSTWLKLNKKVTQQDVKKENPLQFKFRAKFFPEDVSEELIQEITQRLFFLQVKEAILNDEIYCPPETAVLLASYAVQAKYGDYNKEIHKPGYLANDRLLPQRVLEQHKLTKEQWEERIQNWHEEHRGMLREDSMMEYLKIAQDLEMYGVNYFEIKNKKGTELWLGVDALGLNIYEHDDKLTPKIGFPWSEIRNISFNDKKFVIKPIDKKAPDFVFYAPRLRINKRILALCMGNHELYMRRRKPDTIEVQQMKAQAREEKHQKQLERAQLENEKKKREIAEKEKERIEREKEELMERLRQIEEQTMKAQKELEEQTRKALELDQERKRAKEEAERLEKERQAAEEAKSVIAKQAADQLKNQEQLAAELAEFTAKIALLEEAKKKKEEEATEWQHKAFAAQEDLEKTKEELKTVMSAPPPPPPPPVIPPTENEHDEHDENNAEASAELSNEGVMNHRSEEERVTETQKNERVKKQLQALSSELAQARDETKKTQNDVLHAENVKAGRDKYKTLRQIRQGNTKQRIDEFEAMWGPKLYALFQMRSCQSSIKQM +>XP_012920718.1_PREDICTED:_LOW_QUALITY_PROTEIN:_zinc_finger_protein_649-like +MTKAQESLSLEDVAVRFTWEKWQLPGPAQKDLYWDVMLENYSSLVSVGFQASWVDVLSMLEGGEPLWTLEDEIHNQVHPEIEKADDHLQQQLQNQKRPKRVEQCYEQNALGNVQRCKHHFPLRPNHDMFDLYGKILKPXLGLSNQSRRYTIKELAELNADRRSFLCDTHEQTHTKVKSHESRKPTSTESQFLKDQQTYKIEKGHECAKCGEAFLEKSQLTEHKKIHLGKKPHECNTCGKTFYKKFNLTKHQSHLKIHTGNKPHVCPECGKSFARKSLLIVHMPIHIEEKPYLCSECGKEFIQKGNLMIHQRIHMGEKPYRCTDCGKAFSQKICLIAHQRYHTGRMPFVCTECGQSCSQKSVLIRHQRIHSGGKTYKCSDCGKVFITKAKLITHRRTHTGEKPYGCDECKKAYSYMSCLVKHKRTHNREKCSDSMKVENSTVSHTLLDSSTLLQRRNPVDVTVQIPSVTPDTSNISGLLANRSVVPVGQPMARCPPSGENRGFTPERNQSLCITLCHKHAQRRDREVESGARGLPVREQGSAKTSQLAPKSPSPRHSTRNFAADRRRSGGGIEGGIEGGARGLSAPQ +>XP_012923418.1_PREDICTED:_rho_guanine_nucleotide_exchange_factor_11_isoform_X7 +MSVRLPQSIDRLSTLSSLGDSAPERKSPSHHHQPSDTSEATGLVQRCVIIQKDQHGFGFTVSGDRIVLVQSVRPGGAAMKAGVKEGDRIIKVNGTMVTNSSHLEVVKLIKSGAYVALTLLGSSPSSVGVAALQQEPAGHPRVTPMIPPPPPPPPLPPPQRITGPKPLQDPEVQKHATQILRNMLRQEEKELQRICEVYSRNPASLLEEQIEGARRRVTQLQLKIQQETGGLVDILPLYGDASQKPSEGRLSLDSQEADSGLDSGTERLPSLSESWVNRNSVLSDPGLDSPRTSPVIMARVAQHHRRQGSDIPIPLSSEQGVDPSPKPLIIGPEEDYDPGYFNNESDVIFQDLEKLKSRPAHLAVFLRYIFSQADPSPLLFYLCVDVYQQTNPKDSRSLGKDIWSIFLEKNAPLRVKVPEMLQAEIDLRLRNSEDARSILCEAQEAAVPQIQEQIHDYRTKRTLGLGSLYGENDLLDLDGDPQRERQVAEKQLAALGDILSKYEEDRSVPMSFALNTYVSHTGIRLRESRPSSTAEKAQSAPDKDKWLPFFPKAKKSSNSKKEKDVLEDKKRNPILKYIGKPKSSSQSTFHIPLSPVEVKPGNVRNIIQHFENSQQYDAPEPGTQRLSTGSFPEDLLESDSSRSEIRLGRSESLKGREEMKRSRKVENVPRSRSDVDMDAAAEATRLHQSASSSTSSLSTRSLENPTPPFTPKMGRRSIESPSLGFCTDALLPHLLEDDLGQLSDLEPEPDAQNWQHTVGKDVVAGLSQREIDRQEVINELFVTEASHLRTLRVLDLIFYQRMKKENLMPREELARLFPNLPELIEIHNSWCEAMKKLREEGPIIKEISDLMLARFDGPAREELQQVAAQFCSYQSIALELIKTKQRKESRFQLFMQEAESHPQCRRLQLRDLIISEMQRLTKYPLLLENIIRHTQAGTAEHEKLCRARDQCREILKFVNEAVKQTENCHRLEGYQRRLDATALDRASNPLAAEFKSLDLTSRKMIHEGPLTWRISKDKTLDLHVLLLEDLLVLLQRQDERLLLKCHSKTAMGSADSKQTFSPVLKLNAVLVRSVATDKRAFFIICTSELGPPQIYELVALTSSEKNIWMELLEEAVRNATRHPGAALAPVLPRPPGPQEPAHQGPAPSRTGLDDPEVFHSEAEPEELPGGPGTQQRVQGKQPVPPEEPEQEGNAVEGELAALPLPSAALSGENVGVGTRDPIALALPGSLFMEGLADSALEDVENLRHLILWSLLPGHGTDTRAAAEPEDDLTPTPSIIGVTTHPWDPGSPGLAPTSGDGDNAVLPGPEGGQPEHEDAARSLALLPPRTRNSGIWESPELDRNPAEEASSTEEVGSYKVVRKAEVAGSEAVPALPESGQSEPELPEVEGATEAPGNCFYVSMPAGPVDSSTNPSGARTGHPQPQAGSGDPRLPSHSSPGLALRDVGMIFRTIEQLTLKLNRLKDMELAHRELLRSLGGESSGGTTPVGNFHTDTSRWTDSSLSPPATLASEPRDSHEPESHPSDGCDTPPEDSTADIPVSPGL +>XP_004868810.1_PREDICTED:_ATP-sensitive_inward_rectifier_potassium_channel_12_isoform_X1 +MTAASRANPYSIVSSEEDGLHLVTMSGANGFGNGKVHTRRRCRNRFVKKNGQCNIEFTNMDEKSQRYLADMFTTCVDIRWRYMLLIFSLAFLASWLLFGVIFWVIAVAHGDLEPAEGRGRTPCVMQVHGFMAAFLFSIETQTTIGYGLRCVTEECPVAVFMVVAQSIVGCIIDSFMIGAIMAKMARPKKRAQTLLFSHNAVVALRDGKLCLMWRVGNLRKSHIVEAHVRAQLIKPRVTEEGEYIPLDQIDIDVGFDKGLDRIFLVSPITILHEIDEASPLFGISRQDLETDDFEIVVILEGMVEATAMTTQARSSYLANEILWGHRFEPVLFEEKNQYKIDYSHFHKTYEVPSTPRCSAKDLVENKFLLPSANSFCYENELAFLSRDEEDEPEGDQDGCSREGLSPQPRHDFDRRQAGGGALEQRPYRRESEI +>XP_004838994.1_PREDICTED:_long-chain-fatty-acid--CoA_ligase_5 +MKMLFIFNFLFSPLPTPALLCLLTFGAAIFLWLINRPQPVLSRIDLDKQSVGIEGGARKFAFQKNDLARYYFPDAKTMYEIFQRGLAVSDNGPCLGYRKPNQPYRWLSYKQVSDRAEYLGSCLIHKGHKPSPDQFIGIFAQNRPEWVISELACYTYSMVAIPLYDTLGAEATVFIVNKADIPTVICDTPQKASVLIENVEKGLTPCLKLVILMDPFDDDLKQRGEKCGVEVLSLFDAENLGKENFRKPVPPNPEDLSIICFTSGTTGDPKGAMLTHGNIASNVAGFLRSAESVFQPTCNDVTISYLPLAHMFERIVQAVMYSCGAQVGFFQGDIRMLPDDMKALKPTIFPTVPRLVNKIYDKVQNEAKTPLKKFLLNLAVASKFSEVKNGIIRRDSLWDKLIFAKIQNSLGGRVYLVITAAAPISSAVLTFFRAAMGCMVFEAYGQTECTGGCTVTLPGDWTSGHVGPPMCCNYVKLEDVPDMNYFSANNEGEICIKGLNVFRGYLKEPEKTQEVLDKDGWLHTGDIGRWLPNGTLKIIDRKKNIFKLAQGEYIAPEKIENIYSSSGPVSQIFIHGERLQSSLVGVVVPDPDVLPSFAAKLGIKGSLAELCQSKIVKEAILEDLQKIGKENGLKSFEQVKNIFVHPEPFSIENGLLTPTLKAKRGHLTKCFQTQIDSLYESIQE +>XP_004865452.1_PREDICTED:_ceramide_synthase_4 +MLSALNNLVWHERIWLPPSKTWTDMEDQDGMVLAHPRDILVALPLILMLVTARLAFDRFIGMPASRWLGMRDPTRKQVKPNPTLEKYFLQKGQKPEEAQVALLAAQCGLTLQQTQHWFRRRRNQDRPHMSKKFCEASWRFLFYLSTSISGILVLYPEPWLWDVAESWRNYPSQHLKPALSWWYLTELSYYSSLLLRLPFDVKRKDFKEQVMHHFVAVFLIFFSYGANLVRIGSLVLLLHDFGDCLLEACKVLNYMRLSLTCDILFFIFASVFFYTRLILMPTTIIYSVYYDSMKQFTPFFGYYFFLTLLVSLNMLHVYWFSLILRMLYNYLVKGQMTKDIRSDSEESSSSTDEAAPGHPQLKNGMACRPGPALAGSRRSRAKGQLANGHTAAT +>XP_012920615.1_PREDICTED:_heterogeneous_nuclear_ribonucleoprotein_H_isoform_X1 +MMLGTEGGEGFVVKVRGLPWSCSADEVQRFFSDCKIQNGAQGIRFIYTREGRPSGEAFVELESEDEVKLALKKDRETMGHRYVEVFKSNNVEMDWVLKHTGPNSPDTANDGFVRLRGLPFGCSKEEIVQFFSGLEIVPNGITLPVDFQGRSTGEAFVQFASQEIAEKALKKHKERIGHRYIEIFKSSRAEVRTHYDPPRKLMAMQRPGPYDRPGAGRGYNSIGRGAGFERMRRGAYGGGYGGYDDYNGYNDGYGFGSDRFGRDLNYCFSGMSDHRYGDGGSTFQSTTGHCVHMRGLPYRATENDIYNFFSPLNPVRVHIEIGPDGRVTGEADVEFATHEDAVAAMSKDKANMQHRYVELFLNSTAGASGGAYEHRYVELFLNSTAGASGGAYGSQMMGGMGLSNQSSYGGPASQQLSGGYGGGYGGQSSMSGYDQVLQENSSDFQSNIA +>XP_012927576.1_PREDICTED:_beta-centractin_isoform_X3 +MEHGVVRDWNDMERIWQYVYSKDQLQTFSEEHPVLLTEAPLNPSKNREKAAEVFFETFNVPALFISMQAVLSLYATGRTTGVVLDSGDGVTHAVPIYEGFAMPHSIMRVDIAGRDVSRYLQLLLRKEGADFHTSAEFEVVRTIKERACYLSINPQKDEALETEKVQYTLPDGSTLDVGPARFRAPELLFQPDLVGDESEGLHEVLAFAIHKSDMDLRRTLFANIVLSGGSTLFKGFGDRLLSEVKKLAPKDVKIKISAPQERLYSTWIGGSILASLDTFKKMWVSKKEYEEDGPRAIHRKTF +>XP_004875286.1_PREDICTED:_olfactory_receptor_8H1-like +MGRWNSTSVPGFILMGLTDSAETHLLLSMPFLLIYLITVLGNAGMILIIRLDPQLHTPMYFFLTHLSFLDLSYSSVTTPKTLQSLLTSIKSISFLGCFTQMYFFILLAATECFLLSSMAYDRYVAICHPLHYPVIMSTRRCRALLTGSYVIGFIYCTAVVVSMSQLHFCNSNVIQHFFCDTSPVLALSCSDTSEVEIIIFISAGSNLVLNLITTSASYVFILSTILKINSTAGKKKAFSTCASHLLGVTIFYGTMIFTYLKPKTSYSLGKDQVASVFYTIVIPMLNPIIYSLRNKEVKNAAVRFMQKIAGSRQVK +>XP_012924166.1_PREDICTED:_ninjurin-2_isoform_X5 +MLDVALFMSNATRLKAVLEHGPSSHYYTALIALISISLLLQVVIGILLVVIARLNLNEVENQWRLNQLNNAATILVFITVVFNVFITAFGAQKPGFLAAGAARDPL +>XP_012925362.1_PREDICTED:_probable_palmitoyltransferase_ZDHHC16_isoform_X2 +MRGQRSLLLGPARLCLRLLLLLGYRRRCPPLLRGLVQRWRYGKVCLRSLLYNSFGGSETVVDAAFEPVYWLVDNVIRWFGVVFVVLVIVLTGSIVAIAYLCVLPLILRTYSVPRLCWHFFYSHWNLILIVFHYYQAITTPPGYPPQGRNDIATVSICKKCIYPKPARTHHCSICNRCVLKMDHHCPWLNNCVGHYNHRYFFSFCFFMTLGCVYCSYGSWDLFREAYAAIETYHQTPPPTFSFRERITHKSLIYLWFLCSSVALALGALTVWHAVLISRGETSIERHINKKERRRLQAKGRVFRNPYNYGCMDNWKVFLGVDTGRHWLTRVLLPSSHLPHGNGMSWEAPPWVTAHSASVMAV +>XP_004870331.1_PREDICTED:_guanine_nucleotide-binding_protein_subunit_alpha-13 +MADFLPSRSVLSVCFPGCVLTSGEAEQQRKSKEIDKCLSREKTYVKRLVKILLLGAGESGKSTFLKQMRIIHGQDFDQRAREEFRPTICSNVIKGMRVLVDAREKLHIPWGDDDNQLHGDKLMAFDTRAPMAAKGMVETGVFLQYLPAIRALWADSGIQNAYDRRREFQLGESVKYFLDNLDKLGEPDYIPSQQDILLARRPTKGIHEYDFEIKNVPFKMVDVGGQRSERKRWFECFDSVTSILFLVSSSEFDQVLMEDRLTNRLTESLNIFETIVNNRVFSNVSIILFLNKTDLLEEKVQIVSIKDYFLEFEGDPHCLRDVQKFLVECFRNKRRDQQQKPLYHHFTTAINTENIRLVFRDVKDTILHDNLKQLMLQ +>XP_004862734.1_PREDICTED:_beta-galactosidase-1-like_protein_2_isoform_X3 +MSTWSLRRRPGRTLGLLLLVLLSFLVLRRLDWSTLIPPWLRHQRLGLQAKSQNFILEDTTFWIFGGSIHYFRVPREYWRDRLLKMKACGLNTLTTYVPWNLHEPERGKFDFSGNLDLEAFVLLAAEVGLWVILRPGPYVCAEIDLGGLPSWLLQDPGMKLRTTYKGFTEAVDLYFDHLMSRVVPLQYKHGGPIIAVQVENEYGSYNRDPAYMPYVKKALEDRGIIELLLTSDNKDGLQKGVVHGVLATINLQSQQELQLLTTFLLSVQGNQPKMVMEYWTGWFDSWGSPHNILDSSEVLETVSAIVNAGSSINLYMFHGGTNFGFINGAMHFNEYKSDVTSYDYDAVLTEAGDYTAKYGKLRDFFGSRSGAPLPPPPDLLPKMAYEPIAPSFYLSLWDALKYMEKPIKSEKPINMENLPVNDGNGQAFGYTLYETTIASSGVLHGHVRDQGQVFVNTVSIGFLDYKTTKIVIPLIQGYTVLRILVENRGRVNYGNNIDDQRKGLIGNLYLNNSPLKNFRIYSLDMKKSFFQRFGTDKWSTLPEAPTFPAFFLGVLSVVPSPSDTFLKLECDVPFLALVVD +>XP_004865768.1_PREDICTED:_E3_ubiquitin-protein_ligase_UHRF1 +MWVQVRTMDGKETHTVDSLSRLTKVEELRRKIQELFHVEPGLQRLFYRGKQMEDGHTLFDYDVRLNDTIQLLVRQSLVLPSSQERDSELSDTDSGCCLGQSESDKSSTHGEGAADADSKAGLADKDVAETEQGLYKVNEYVDARDTNMGAWFEAQVVGVLRKVRMAEDKPCSSTTSPTPEENVIYRVKYDDYPENGVVTMQSHNVRARARTILKWHELEVGQVVMLNYNSDHPRERGFWYDAEICRKRETRTGRELYANIRLGDHSLHNCRIVFMDEVFKIERPGEAPPVVENPMRRKSGPSCKYCKDDPNKLCRICACHRCGGREAPDKQLMCDECDMAYHLYCLDPPLSSVPPPEEDWYCPDCRNEPSEVVLAGQRLRESKKKAKMASATSSSQRDWGKGMACVGRTKECTIVPSNHYGPIPGIPVGTMWRFRVQVSESGVHRPHVAGIHGRSNDGAYSLVLAGGYEDDEDNGNSFTYTGSGGRDLSGNKRTAGQSSDQKLTNTNRALALNCYAPINDKKGAESKEWRSGKPVRVVRNMKGGKHSKYAPAEGNRYDGIYKVVKYWPEKGKSGFLVWRYLLRRDDVEPGPWTKEGKDRTKKLGLTMQYPEGYLEALANRDKENKRAAEEQEDLSPSKKGKWKRKSAGQSGSQPQTTKKTKLEPYRLTAEQSNLIKADESNTKLWTEVLTALREGLFQVFLSKVEETFQCICCQELVFQPVTTVCQHNVCKDCLDRSFRAQVFSCPACRYDLGRGYAMQVNTALQTILSHFFPGYGSGR +>XP_004850463.1_PREDICTED:_paired_box_protein_Pax-7_isoform_X1 +MAGLPGAVPRMMRPAPGQNYPRTGFPLEVSTPLGQGRVNQLGGVFINGRPLPNHIRHKIVEMAHHGIRPCVISRQLRVSHGCVSKILCRYQETGSIRPGAIGGSKPRQVATPDVEKKIEEYKRENPGMFSWEIRDRLLKDGHCDRSTVPSVSSISRVLRIKFGKKEEDDEADKKEDDGEKKAKHSIDGILGDKGNRLDEGSDVESEPDLPLKRKQRRSRTTFTAEQLEELEKAFERTHYPDIYTREELAQRTKLTEARVQVWFSNRRARWRKQAGANQLAAFNHLLPGGFPPTGMPTLPPYQLPDSTYPTTTISQDGGSTVHRPQPLPPSTMHQGGLAAAAAAADTSSAYGARHSFSSYSDSFMNPGAPSNHMNPVSNGLSPQVMSILSNPSAVPPQPQADFSISPLHGGLDSASSISASCQRADSIKSGDSLPTSQSYCPPTYSTTGYSVDPVAGYQYGQYGQTAVDYLAKNVSLSTQRRMKLGEHSTVLGLLPVETGQAY +>XP_004834603.1_PREDICTED:_SLIT_and_NTRK-like_protein_3 +MMKPSIAEMLHRGRMLWIILLSTIALGWTTPIPLIEDSEEIDEPCFDPCYCEVKESLFHIHCDSKGFTNISQITEFWSRPFKLYLQRNSMRKLYTNSFLHLNNAVSINLGNNALQDIQMGAFNGLKILKRLYLHENKLDVFRNDTFLGLESLEYLQADYNVIKRIESGAFRNLSKLRVLILNDNLIPMLPTNLFKAVSLTHLDLRGNRLKVLFYRGMLDHIGRSLMELQLEENPWNCTCEIVQLKSWLERIPYTALVGDITCETPFHFHGKDLREIRKTELCPLLSDSEVEASLGIPHLSSSKENAWPTKPSSMLSSVHFTASSVEYKSSNKQPKPTKQPRTPRPPSTSQALYPGPNQPPIAPYQTRPPIPIICPTGCTCNLHINDLGLTVNCKERGFNNISELLPRPLNAKKLYLSSNLIQKIYRSDFWNFSSLDLLHLGNNRISYVQDGAFINLPNLKSLFLNGNDIEKLTPGMFRGLQSLHYLYFEFNVIREIQPAAFSLMPNLKLLFLNNNLLRTLPTDAFAGTSLARLNLRKNYFLYLPVAGVLEHLNAIVQIDLNENPWDCTCDLVPFKQWIETISSVSVVGDVLCRSPENLTHRDVRTIELEVLCPEMLHIAPTGASPAHSGDSHFVGSPTSVSPYELSPPGVPVPLSVLILSLLVLFFSAVFVAAGLFAYVLRRRRKKLPFRSKRQEGVDLTGIQMQCHRLFEDGGGGGGGSAGGGRPTLSSPEKAPPVGHVYEYIPHPVTQMCNNPIYKPREEEEVVASAGQDTGSAERGGPGTQAPGMGEVLLGSEQFAETPKETHSNYRTLLEKEKEWALAVSSSQLNTIVTVNHHHPHPHHSAVGGVPGVVGGAGGDLSGFRHHEKNGGVVLFPPGGGCGGGSMLLDRERPQPGPCAVGFVDCLYGTVPKLKELHVHPPGMQYPDLQQDARLKETLLFSAGKGFTDHQTQKSDYLELRAKLQTKPDYLEVLEKTSYRF +>XP_004836794.1_PREDICTED:_TBC1_domain_family_member_9B_isoform_X2 +MWLGPEEVLVAHALWVTERANPFFVLQRRRGHGKGGGLTGLLVGTLDVVLDSSARVAPYRILHQTQDSQVYWTVACGSSRKEITKHWEWLENNLLQTLSIFDNEEDIITFVKGKIHGIIAEENKSLQPQGDEDPGKFKEAELKMRKQFGMPEGEKLVNYYSCSYWKGRVPRQGWLYLTVNHLCFYSFLLGKEVSLVVQWVDVTRLEKNATLLFPESIRVDTRDKELFFSMFLNISETFKLMEQLANLAMRQLLDSGGFLEDKALPRPVRPHRNISALKRDLDARAKNECYRAMFRLPRDEHLDGHTGCTLWTPFNKLHNPGQMFISNNYICFASKEEDACHLIIPLREVTIVEKADSSSVLPSPLSISTKSKMTFLFANLKDRDFLVQRISDFLQKMPSKQPGSSSSRSLSLGGGRASTVGPAPESLPAPQELPETPTSPTSPLCSRLSFGAQDVPTVSQGLLKVFQRHPAMEDLGAKGAKEKAKEEAWDIHFFEYGRGMCMYRTATTRQLVLKGIPESLRGELWLLFSGAWNEMVTHPGYYTELVEKSTGKYSLATEEIERDLHRSMPEHPAFQNELGIAALRRVLTAYAFRNPTIGYCQAMNIVTSVLLLYGSEEEAFWLLVALCERMLPDYYNTRVVGALVDQGIFEELTRDFLPQLSEKMQDLGVISSISLSWFLTLFLSVMPFESAVVIVDCFFYEGIKVILQVALAVLDANMEQLLDCSDEGEAMTVLGRYLDNVVNKQSISPPIPHLHALLTSGDEPPVEVDVFDLLKVSYEKFSSLRADDLEQMRFKQRLKVIQSLEDTAKRSVVRAIPGDIGFSIEELEDLYVVFKAKHMESQYWGSSRTAAAGHRDPSLPYLEQYRIDASQFQELFTSLTPWACGSHTPVLAGRMFRLLDQNRDLLINFKEFVTGMSAMYHGDLTEKLKALYKLHLPPALSPEEAESALEATHYFTEDSSSEEALPQEEREGNGNEDARGKKREEKGTSPPDYRHYLRVWAKEKEAPKETIKDLPKMNQEQFIELCKTLYSMFSEDPLEQGLYHAIATVASLLLRIGEVGKKLSAQSGRKPRGGAHAGDHSSAAEEDEPRTPGPPQDPTRAFQPPAAEDWRASAGGDTHEGKAAQESRAAAEGGSGGGRGSDDDTKDSMSMSSYSVVSTGSLQCEDLTDDTVLVGGEAHGPSASSRARGTVDADWCISFEQILASILTESVLVNFFEKTVGISTKIKDQKVVERQLSTSSEQEQSGASG +>XP_012931822.1_PREDICTED:_sarcoplasmic/endoplasmic_reticulum_calcium_ATPase_1_isoform_X3 +MGKVYRADRKSVQRIKARDMVPGDIVEVAVGDKVPADIRILSIKSTTLRVDQSILTGESVSVIKHTDPIPDPRAVNQDKKNMLFSGTNIAAGKAVGIVATTGVNTEIGKIRDQMAATEQDKTPLQQKLDEFGEQLSKVISLICVAVWLINIGHFNDPVHGGSWFRGAIYYFKIAVALAVAAIPEGLPAVITTCLALGTRRMAKKNAIVRSLPSVETLGCTSVICSDKTGTLTTNQMSVCKMFIVDKVDGDICLLNEFSITGSTYAPEGEVMKNDKPVRAGQYDGLVELATICALCNDSSLDFNEAKGVYEKVGEATETALTTLVEKMNVFNTDVRSLSKVERANACNSVIRQLMRKEFTLEFSRDRKSMSVYCSPAKSSRASVGNKMFVKGAPEGVIDRCNYVRVGTTRVPLTGPVKEKILSVIKEWGTGRDTLRCLALATRDSPPKREEMVLDDSSKFMEYEMDLTFIGVVGMLDPPRKEVTGSIQLCRDAGIRVIMITGDNKGTAIAICRRIGIFSESEEVTDRAYTGREFDDLPLAEQRDACRRACCFARVEPSHKSKIVEYLQSYDEITAMTGDGVNDAPALKKAEIGIAMGSGTAVAKTASEMVLADDNFSTIVAAVEEGRAIYNNMKQFIRYLISSNVGEVVCIFLTAALGLPEALIPVQLLWVNLVTDGLPATALGFNPPDLDIMDRPPRSPKEPLISGWLFFRYMAIGGYVGAATVGAAAWWFLYADDGPHVSYYQLTHFMQCTEHNAEFGGLDCEVFEAPEPMTMALSVLVTIEMCNALNSLSENQSLVRMPPWVNVWLLGSICLSMSLHFLILYVDPLPMIFKLQPLTVTQWLMVLKISLPVIGLDEILKFVARNYLEG +>XP_004875135.1_PREDICTED:_trace_amine-associated_receptor_1-like +MMLVCHSVMNISCVESSRSHDVRVSLYSLMVIIILTTLVGNLIVIISISHFKQLHTPTNWLIHSMALVDFLLGCLVMPYSMVRSVEHCWYFGEIFCKIHTSTDIMLSSASIFHLSFISIDRYYAVCDPLRYKARMNIWVTFVMIFISWSVPALLAFGMIFMELNIKGAEEMYCKHIYCKGGCAVFFSKITGVLAFMISFYIPGSIMLCVYCRIYFIAKGQARSIKGTSQKLQTGLEERNGISQSKERKAATTLGIVLGVFLICWCPFFVCTIMDPFLNYTIPLALNEALIWFGYLNSTFNPMVYAFFYPWFRRALKIILFGKIFQKDSSRCKVFLDSNP +>XP_004871904.1_PREDICTED:_type_III_endosome_membrane_protein_TEMP_isoform_X1 +MSSGPFMREANQTHMGPSELPTASAMAPEPGTAGRAWPVLVGVVLGAVVLSVIIALAAKCHLCRRYRASFQHHQLSRTGSENHPEVGEEDDDGFIEDNYIQPGAGELETEGSRDHFPL +>XP_004870529.1_PREDICTED:_nuclear_receptor_subfamily_2_group_C_member_2_isoform_X2 +MTSPSPRIQIISTDSAVASPQRIQIVTDQQTGQKIQIVTAVDASGSSKQQFILTSPDGAGPGKVILASPETPSPKQLIFTTSDSLVPGRIQIVTDSASVERLLGKAEVQRPQVVEYCVVCGDKASGRHYGAVSCEGCKGFFKRSVRKNLTYSCRSSQDCVINKHHRNRCQFCRLKKCLEMGMKMESVQSERKPFDVQREKPSNCAASTEKIYIRKDLRSPLIATPTFVAEKDGASRQPGLLDPGMLVNIQQPLIREDGTVLLATDSKAETSQGALGTLANVVTSLANLSESLNNGDTSDIQPEDQSASEITRAFDTLAKALNTADGTSPPSLADGLDASGGGGIHVISRDQSTPIIEVEGPLLSDTHVMFKLTMPSPMPEYLNVHYICESASRLLFLSMHWARSIPAFQALGQDCNTSLVRACWNELFTLGLAQCAQVMSLSTILAAIVNHLQNSIQEDKLSGERVKQVMEHIWKLQEFCNSMARLEIDGYEYAYLKAIVLFSPDHPGLTGTSQIEKFQEKAQMELQDYVQKTYSEDTYRLARILVRLPALRLMSSNITEELFFTGLIGNVSIDSIIPYILKMETAEYNGQITGASL +>XP_004862313.1_PREDICTED:_transmembrane_protein_9 +MKLLSLVAVAGCLLVPPAQAYKSSEDIRCKCICPPYRNISGHIYNQNVSQKDCNCLHVVEPMPVPGHDVEAYCLLCECRYEERSTATIKVIIVIYLSVVGALLLYMAFLMLVDPLIRKPDAYTEQLHNEEENEDARSMAATASSLGGPRANTVLERVEGAQQRWKLQVQEQRKTVFDRHKMLS +>XP_004839092.1_PREDICTED:_protein_odd-skipped-related_1 +MGSKTLPAPVPIHPSLQLTNYSFLQAVNGLPTVPSDHLPSLYGFSALQAVHLHQWTLGYPAMHVPRSSFSKVPGAVSSLVDARFQLPAFPWFPQVIQPKPEIAAAGSGPALKSKPRFDFANLALAATQEDPSKLVRGEGPGSPTGGLGALLDVTKLPPEKKPTRGRLPSKTKKEFVCKFCGRHFTKSYNLLIHERTHTDERPYTCDICHKAFRRQDHLRDHRYIHSKEKPFKCQECGKGFCQSRTLAVHKTLHSQVKELKTPKIKC +>XP_012925113.1_PREDICTED:_LOW_QUALITY_PROTEIN:_regulatory_solute_carrier_protein_family_1_member_1-like +MSSLPTSDGFTHPAHSSGPSPEIGNPMSLAHSAFASVCPIKLSDPDSIQPKAVKALKASVEFQMNSKKKELLPLQDPSDHVSSADQSPAMPLHNSSEEAVIRDNLEKFAERSSQGXLHTRQGASLSVTTAXMHEPLMLVDKKCWHPENQNLHQLNGLHQHTEPGNKQHEVQQNAPHDQGHLCDLGDIQLPEEKQQDQQKIVDLKASMKEEGLQQNSDLPSPEKSFLPSGCFGSSNSEMLMEIEVVEQSIVSVLKSTCSQNANVENIGVSSLTSDNPLMEVETSKCNPSSASVNNSISTQNLQXPESNIEMSGTNNEYGNSLPTLSLCGSCQPSVESTEESCSSVTAALKELHELLVSSSKPAPENTSKVICQSETIPEGQKGVKDFSERWTQNDHLPHREPCPQVFCHQASSVSVKSESLGAVPGTGTEDTEDSSSQGPSDGLSADKDGVPRSTESVSESSSVTITSAESSNQLHCTLGVEISPSLTASEDALSQTSEQTESLPSSFILVKDLGHGIQNLATDRPETRENACPDTARPFLELDPLTSHLSSPSLLSPLIFPATDIDRILWAGFTLQEALGALHRVGGNADLALLVLLAKNIVVAT +>XP_004850674.1_PREDICTED:_aurora_kinase_A_and_ninein-interacting_protein_isoform_X2 +MLTLLPRERKPVSFTQRRIPSAGIKQTSIASFTLKTGMTDVGNQSSVSSHTESQINKESKTDTTQLDCLIRDSEDDCIAPPLAMSTPEDIQETGLSPWSHKTSGHYNVRSPFLTMPQPNSLVCAGDSKASLAFSCLLDQKDSSRKKEWFYGSEKNYQGMERHIRPPGGKCHQLLDKAKSERKVSVKENRQRSVHLQTFRESWSRENTESVKQNRCPVSVFSWDSEKNDKESWSQLFTEDSQGQRVIAHRRAPFQDVSNTWHQGLGHFPTSPRAESQAGHTQLNLQPDLLLTQDSEGNQVIRHQF +>XP_012932632.1_PREDICTED:_nuclear_factor_of_activated_T-cells,_cytoplasmic_2_isoform_X2 +MDAPEPKCDPDGRNAPGHEPAGSPQDEFDFSILFDYDYVNPFEEEPNAHKVASPPSGLAYPDDVPDCGLQPYSPLASLSGEPPGRFGEPDRLGPQNFLSPAKPAGASGLSPRIEITPSHELIQAGVPLRMRDAGLLLEQPALAGVAASPRFTLPVPGFEGYREPLCLSPASSGSSASFISDTFSPYTSPCVSPNNGGGPDDLCPQFQNIPAHYSPRTSPIMSPRTSLAEDSCLGRHSPVPRPASRSSSPGAKRRHSCAEALVAPLPGASPQRSRSPSPQPSSHVAPRDDGAPAGYPPTAGSAVLMDALNSLATDSPCGIPPKVWKTSPDPSPVSAAPAKAGLPRHIYPAVEFLGPCEQEDRRNSAPESILLVPPTWPKQLVPAIPICSIPVTASLPPLEWPLSNQSGSYELRIEVQPKPHHRAHYETEGSRGAVKAPTGGHPVVQLHGYMENKPLGLQIFIGTADERILKPHAFYQVHRITGKTVTTTSYEKIVGNTKVLEIPLEPKNNMRATIDCAGILKLRNADIELRKGETDIGRKNTRVRLVFRVHIPESSGRIVSLQTASNPIECSQRSAHELPMVERQDIDSCLVYGGQQMILTGQNFTAESKVVFTEKTTDGQQIWEMEATVDKDKSQPNMLFVEIPEYRNKHIRTSVKVNFYVINGKRKRSQPQHFIYLPVPAVKTEPSDEYDPSLICSPAHGGLGSQPYYPQHPMVAESPSCLVATMAPCQQFRSGLSSPDARYQQQNPAAVLYQRSKSLSPSLLGYQQPALMAAPLSLADAHRSVLVHTGSQGQNPALLHPTPANQQASPVIHYSPTNQQLRCGSHQEFQHIMYCENFAPGTARPGLPPVSQGQRLSPGSYPTVIQQQNAPSQRAAKNGPPVSEQKEVLPTGVTIKQEQNLDQTYLDDELIDTHLSWIQNIL +>XP_012923780.1_PREDICTED:_glycosylphosphatidylinositol-anchored_high_density_lipoprotein-binding_protein_1 +MKALEAVVLALLLCGQPGSRQAQEEEEEDDRRPESYGYDEEEEEEEEETNMITGSRDRALQCYACPLLHHGESCDQMQSCSGSRASCIMLVTHGNTDSGLLTTYSMWCTDSCQPIIKTVEGTQMTETCCQSPMCNVPPWQHPQVQDPLNGKAGSPQDSRAGHPQSNGSCSLSSCPQHVSTALLLSLLTSLLAVRA +>XP_004853488.1_PREDICTED:_methyltransferase-like_protein_13_isoform_X3 +MNLLPKSSKEFGSVDYWEKFFQQRGKQAFEWYGTYLELCGVLHKYIKPREKVLVIGCGSSELSGQLYDVGYQDMVNIDISEVVIKQMRERNARRRPQMSFLKMDMTRMEFPDASFQVVLDKGTLDAVLTDEEEKTLQLVDRMLAEIGRVLQVGGRYLCISLAQAHVLKKAVGHFSREGWMVRVHQVASSQDQALESEPRFSLPVFAFVMTKFRPVPGSALQIFELCAQEQGKPVRLESAERLAEAVQERQQYAWLCGQLRCKAGLGSVSLDLCSGDTGEPRYTLHVVDSPAVKPSRDNRFAIFIIPQGRETEWLFGMEEGRKQLAASAGFRRLITVALHRGQQYDSMDSIQAELSARVMELAPAGMPAQQQVPFLSVGGDIGVRTVQHQDCSPLSGDYVIEDVQGDDRRYFRRLIFLSNRNVVQSEARLLKDVPHRAQKKRKKDKKKQWPVETSEDLPPAPEQSIDKSYLCCEHHKAMIAGLALLRNPELLLETPLALLVVGLGGGSLPLFVHDHFPKSYVDAVEIDPSMLEVATQWFGFSQSDRMKVHIADGLDYISSLAGGEARTHYDVIMFDADSKDPALGMSCPPPGFVDRPFLQKVKSILTQEGELKEK +>XP_004852439.1_PREDICTED:_ribonuclease_H2_subunit_C_isoform_X2 +MESGDESAMEKQRVHVRPATLHDSSPATLHLLPCEVLANRFAPVGRFFTPAIRQGADGLHVSFRGRSLRGEEVSVPPGLTGYVMVTEKREGLIGKQDFRGSENNGEEAQEPLERGFDQFIGATGSFSCFTVWGLETVPGPEAKVWGALTWPTLAAAIHAQVPED +>XP_012930631.1_PREDICTED:_sorbin_and_SH3_domain-containing_protein_2_isoform_X12 +MNTDSGGCARKRAAMSVTLTSVKRVQSSPNLLAAGRDSQSPDSAWRSYNDRIQETLNGDATYSSLAAKGFRSVRPNLQEKKSPTQAPLPPARKESFCSSLITSHTQGDILDSSETNTQTPSCTEFLTNKKPLPGTMHSNEDSNSTIIYSEESNTTVSYTQKIANPLPGASSTSPAPFANINTPFLQENYMQDSQTQRISTLKLTHNQDLGSTIPFHIPRFSNPVEVPSFLKKTCSPPPKPVPEVHTASLSIQIAPLSGQDPESHKQLPELSPETTKIPLQQERQKSAVAATSQSSDCRSGNQHLTANVLEVNASQTHRQTTSEAASSCHSPVIPFNQTTFSPGSGFSPVSAPDDLGPSGLYKPQGFPHCLYKYPTPALERLIHSQDTGSLRTDSSLSESESSTAILVELQMGNSDTTDCSETPSPASGQRSAVTDGTILTTPAATHSQITVNGNSGGAVSPMSYYQRPFSPSAYSLPGSLNSSLIMQHGRSLDSSETYSQHAQSLDGTTGSSIPLYRSSEEEKRVTVIKAPHYPGIGPVDESGIPTAIRTTVDRPKDWYKTMFKQIHMVHKPDDDTDMYNTPYTYNAGLYNAPYSAQSHPAAKTQTYRPLSKSHSDNGTDAFKEASSPVPPPHVPPRPRDRSSTEKHDWDPPDRKVDTRKFRSEPRSIFEYEPGKSSILQHERPASIYQSSIDRSLERPSSSASMASDFRKRRKSEPAVGPPRGLGDHIARRTSPSRADLPGSSTTLTKSLISSSPSSPSRAKDRESPRSYASTLTDLGRSAPRERRGTPEKEKLPAKAVYDFKAQTSKELSFKKGDTVYILRKIDQNWYEGEHYGRVGIFPISYVEKLTPPEKAQPARPPPPAQPGEIGEAIAKYNFNADTNVELSLRKGDKIILLKRVDQNWYEGKIPGTNRQGIFPVSYVEVVKKNTKGAEDYPEPPIPHSYSSDRIHSLSSNKPQHPVSTHENIQGGGEPFQALYNYTPRNEDELELRESDVIDVMEKCDDGWFVGTSRRTKFFGTFPGNYVKRL +>XP_004853054.1_PREDICTED:_interferon_regulatory_factor_2_isoform_X2 +MPVERMRMRPWLEEQINSNTIPGLKWLNKEKKIFQIPWMHAARHGWDVEKDAPLFRNWAIHTGKHQPGVDKPDPKTWKANFRCAMNSLPDIEEVKDKSIKKGNNAFRVYRMLPLSERPSKKGKKPKTEKEDRVKHIKQEPIESSLGLSNGVSDLSPEYAVLTSAIKNEVDSTVNIIVVGQSHLDSNIEDQEIVTNPPDICQVVEVTTESDEQPVSMSELYPLQISPVSSYAESETTDSVPSDEESAEGRPHWRKRNIEGKQYLSNMGTYPLPGMVTFVTSNKPDLQVTIKEESSPMPYSTSWPMLSDLSLPASVTPMPSSSRPDRETRASVIKKTSDITQPRVKSC +>XP_004842780.1_PREDICTED:_ubiquitin_carboxyl-terminal_hydrolase_10_isoform_X1 +MIAGGRPHFITLCPPRLSAWSVVPTCCPGLEAFLSFLLQVEQNTLPPYSGTALCGTQAADELPDGQEYQRIEFGVNEVIDPSDTLPRAPGNSISSTLNPQAPEFILGCTASKKTPDGLDQEVNSSSLDHPYPGPALALDSSSHAEAEALENTGGPGGLGQRERKRKKKRPPGYYSYLKTGGDESISTEAVVNGHANSAGLGGVGAEDAEFMGDMLPPVSPRTCDSPQNSTDFISDTVPDSPYPGALDSAARTVGQPEGCCGPDFEQACLPADRLLRTAVAPPCAATDTTENLGITNGQVLESSSVGTAANGELHTVESTDSDVAKLERAPPPADSVLPAPIPINQPAKSWASLFHDAKPSSSSPVAYVETKCSPPAPSPLVSEKQVEVKEGLVPVSEDPVAMQIAELLENVTLVHKPVSLQPRGLINKGNWCYINATLQALVACPPMYHLMKFIPLYSKVQRPCTSTPMIDSFVRLMNEFTNMPVPPKPRQALGDKIVRDIRPGAAFEPTYIYRLLTVIKSSLSEKGRQEDAEEYLGFILNGLHEEMLSLKRLLSPDSEKLTVSNGPRSPLPKDAAQQEQGEGSEEEWEQVGPRNKTSVTRQADFVQTPITGIFGGHIRSVVYQQSSKESATLQPFFTLQLDIQSDKIRTVQDALESLVARESVQGYTTKTKQEVEISRRVTLEKLPPVLVLHLKRFVYEKTGGCQKLAKNIDYPVDLEISRELLSPGVKNKNFKCHRTYRLFAVVYHHGNSATGGHYTTDVFQIGLNGWLRIDDQVVKVIQQYQVLKPAAERTAYLLYYRRVDLL +>XP_004850280.1_PREDICTED:_39S_ribosomal_protein_L13,_mitochondrial +MSSFSRASQQWATFARMWYLLDGRMQPPGKLAAVASVKLQGLHKPVYHQISDCGDHVVIMNTRHIAFSGNKWEQKVYSSHTGYPGGFQQVTAIQLHLRDPVAIVKLAVYGMLPKNLHRRTMMQRLHLFPDEDIPEDLLRNLVEELPQPRKVPQRLDEYTQEEREAFPRVWSPPEDLRL +>XP_004858742.1_PREDICTED:_kelch_domain-containing_protein_9_isoform_X3 +MAAAAAPGGRAGGSGWTWRPVACDALLARAFHSSTELGGRFYLVGGLLAGGATAPSSDTVLFDPAGAQAVRLGAQGSAPRSHHDAAPVDGRWLCIVGGWDGSRRLAAVAALDTERGAWEEWKAAPGNCPPAGLSSHTCTRLSDRELLVAGREGGVRTQRRYGNIYALKLDPGARTYCYKEEGCRTSSRSGHSAALIQTPGPHPGHQLLLFGGCNSAEPEVAGQWSHGKIKSPFFLPQGAATCCPSLDRTACKACKQWKGGSTGAPWTAASLLFCGGALCCAIWWRKSDQS +>XP_012925095.1_PREDICTED:_double-strand_break_repair_protein_MRE11A_isoform_X3 +MGDRPVQFEIISDQSVNFGFSKFPWVNYQDGNLNISIPVFSIHGNHDDPTGADALCALDILSCAGFINHFGRSMSVEKIDISPVLLQKGSTKIALYGLGSIPDERLYRMFVNKKVTMLRPKEDESSWFNLFVIHQNRSKHGSTNFIPEQFLDDFIDLVIWGHEHECKIAPTKNEQQLFYVSQPGSSVVTSLSPGEAVKKHVGLLHIKGRKMNMQKIPLQTVRPFFMEDVVLANHPNIFNPDNPKVTQAIQSFCLEKIEEMLENAERERLGNSQQPEKPLLRLRVDYSGGFEPFNIHRFSQKFVDRVANPKDIIHFFRHREQKEKTGEEINFGKLITKPSEGTTLRVEDLVKQYFQTAEKNVQLSLLTERGMGEAVQEFVDKEEKDAIEELVKYQLEKTQRFLKERHIDALEDKIDEEVRRFRESRQKNTSEEDDEVREAMSRARALRSQSEDSASAFSADDLMSMDLAEQMANDSDDSISTAPSRGRGRGRGQRGGRGQNLAPRGGSQRGRAGTGLNTFTRSRSSRTTVSTSRNMSILDAFKSSRQQPSRNVATKNYSEVIEVDESDEEEDIFPTTSKTDQRWSSISASKPTSQSQIAKGIDFESEEEDDDDPFMSINSLRRNRR +>XP_012926282.1_PREDICTED:_regulator_of_telomere_elongation_helicase_1_isoform_X9 +MPKIVLNGVTVDFPFQPYQCQQEYMSKVLECLQKKVNGILESPTGTGKTLCLLCTTLAWREHLWDTVSARKIAERAQGELFLDQALSAWGSATAADGEPIACYTDIPKIIYASRTHSQLTQVINELRNTAYRPRVCVLGSREQLCIHPEVKKQESNHMQIHLCRKKVASRSCHFYNNVEEKSLEQELVTPILDIEDLVKNGSKHKVCPYYLSRNLKQQADIIFMPYNYLLDAKSRKAHNIDLKGTVVIFDEAHNVEKMCEESASFDLTPHDVASGLDAIGQVLEEQTRVVQQSELQLGLSLDPTSSGLNMQLEDIAKLKMILLRLEGAIDAVQLPGDGSGVTKPGSYIFNLFAEAQITFQSKVCILESLDQIIQHLAGRAGVFTNTAGLQKLMDIIQIVFSVDPTEGSPGISQSYKVHIHPDIGPRRAAQRSDAWSAAASRKQGKVLSYWCFSPGHSMQELLRQGVRTVILTSGTLAPLSSFVLEMQIPFPVCLENPHVIDKHQLWVGVIPRGPDGAELSSAFDKRFSEECLSSLGKTLGNIARVVPHGLLVFFPSYPVMENSLAFWRARDLARKVEVLKPLFVEPRSKGSFSEVIDAYYQRVASPGSSGATFLAVCRGKASEGLDFSDINGRGVIITGLPYPPRMDPRVVLKMQFLDEMRGQSQAGGQFLSGQEWYRQQASRAVNQAIGRVIRHRHDYGAIFLCDHRFTYADAKAQLPSWVRPYLKVYNNFGHVIRDVAQFFRVAQRTMPAPVPRALAPGVGEGKAAAKVTTLPGPLLATRKATSLDVHVPSLRQKPAGSPAVEDPESNLCVEYEQEPVTAPWRPMGLLAALEHSEQKAGAPEDEAYPGKEAVGRSTLSLQCEKRLADEQRGGRKKVRLVSHQEKPEAGTQEERAKLFMVAVKQTLSQASFDTFTQALKVYKGSDDLKALMDCLSCLFAEDPKKHTLLQGFYQFVRPHHKQQFKDICIQLTGQGCSSWPEPGLSHRQQALPALGPSGPQEHVSSGKRGPEPTLTQSKEVAKQLDPGVHLNQGDTHSCPEVWSTVEQGQSAASAYLADIREALGCAAHRQLLAALKVYKQDDNFDKVLAVLAALTTARPEDLPLLQRFSMFVRPHHKQHFLQTCADLMGLPASGRELGPLEESPTTPELSHGAPQSGPSLLQRPRRVQSKIFSFLKQTPDDGL +>XP_012931552.1_PREDICTED:_set1/Ash2_histone_methyltransferase_complex_subunit_ASH2_isoform_X5 +MAAAGTGLGSGAGAGPGSGAAANAITAEDGETKPVAAIAAAPAGEGASTAPTPAEPSSGEAESRDANLVDVSGGLETESSNGKETLEGAGDTSEAMDTQAGSVDEENGRQLGEVELQCGICTKWFTADTFGIDTSDLKIIIRSENEKLLILGIFPAASRSCLPFMTNYSFHCNICHHSGNTYFLRKQANLKEMCLSALANLTWQSRTQDEHPKTMFSKDKDIIPFIDKYWECMTTRQRPGKMTWPNNIVKTMDLSNIGPAYDNQKQSSAVSTSGNLNGGATFGGGITAGSSGKGRGAKRKQQDGGTTGTTKKARSDPLFSAQRLPPHGYPLEHPFNKDGYRYILAEPDPHAPDPEKLELDCWAGKPIPGDLYRACLYERVLLALHDRAPQLKISDDRLTVVGEKGYSMVRASHGVRKGTWYFEITVDEMPPDTAARLGWSQPLGNLQAPLGYDKFSYSWRSKKGTKFHQSIGKHYSSGYGQGDVLGFYINLPEDTETAKSLPDTYKDKALIKFKSYLYFEEKDFVDKAEKSLKQTPHSEIIFYKNGVNQGVAYKDIFEGVYFPAISLYKSCTVSINFGPCFKYPPKDLTYRPMSDMGWGAVVEHTLADVLYHVETEVDGRRSPPWEP +>XP_012926364.1_PREDICTED:_kynurenine--oxoglutarate_transaminase_3_isoform_X5 +MSSKLKNAKRIEGLDSNVWVEFTKLAADPSVVNLGQGLPDISPPTYVKEELSKIALVDNLNQYTRGFGSDLGPCPCAADGKTTELNPRPCPFSLESSCLSSVTTAVLTVSGHPSLVKALSCLYEKFYQNQIDPNKEILVTVGAYGSLFNAIQGLIDEGDEVIIIVPFYDCYEPMMRMAGATPVFIPLRSKAVCGKKWSSSDWTLDPQELESKFNSKTKAIILNTPHNPLGKVYTKEELQLIAHLCIKYDTLCISDEVYEWLVYTGNKHLKIATFPGMWERTVTIGSAGKTFSVTGWKLGWSIGPHHLIKHLQTVQQNTIYTCATPLQEALAQALWIDIKRMDDPECYFNSLPKELEVKRDRIVHLLESVGLKPIVPDGGYFIIADVSSIDADLSDMMNNEPYDYKFVKWMTKNKKLAAIPVSAFCNSETKSQFEKFVRFCFIKKDSTLDAAEEIIKTWNRQRSQSGQNV +>XP_004839687.1_PREDICTED:_dedicator_of_cytokinesis_protein_4_isoform_X4 +MWIPTELEKYGVVIASFRGTIPHGLSLEIGDTVQILEKCDGWYRGFALKNPNIKGIFPSSYVHLKNACVKNKGQFEMVIPTEDSVITEMTSTLRDWGTMWKQLYVRNEGDLFHRLWHIMNEILDLRRQVLVGHLTHDRMKDIKRHITARLDWGNEQLGLDLVPRKEYAMVDPEDISITELYRLMEHRHRKKDTPVQASSHHLFVQMKSLMCSNLGEELEVIFSLFDSKENRPISERFFLRLNRNGLPKAPDKPERHCSLFMDLGSSELRKDIYITVHIIRIGRMGAGEKKNACSVQYRRPFGCAVLSIADLLTGETKDDLVLKVYMCNTESEWYQIHENIIKKLNARYNLTGSNAGLAVSLQLLHGDIEQIRREYSSVFSHGVSITRKLGFSNIIMPGEMRNDLYITIERGEFEKGGKSVARNVEVTMFIVDSSGQTLKDFISFGSGEPPASEYHSFVLYHNNSPRWSELLKLPIPVDKFRGAHIRFEFRHCSTKEKGEKKLFGFSFVPLMQEDGRTLPDGTHELIVHKCEENTNLQDTTRYLKLPFSKGIFLGNNNQAMKATKESFWITSFLCSTKLTQNGDMLDLLKWRTHPDKITGCLSKLKEIDGSEIVKFLQDTLDTLFGILDENSQKYGSKVFDSLVHIINLLQDSKFHHFKPVMDTYIESHFAGALAYRDLIKVLKWYVDRITEAERQEHIQEVLKAQEYIFKYIVQSRRLFSLATGGQNEEEFRCCIQELLMSVRFFLSQESKGSGALSQSQAVFLSSFPAVYSELLKLFDVREVANLVQDTLGSLPTIMHVDDSLQAIKLQCIGKTVESQLYTNPDSRYILLPVVLHHLHIHLQEQKDLIMCARILSNVFCLIKKNSSEKSVLEEIDVIVASLLDILLRTILEITSRPQPSSSAMRLQFQDVTGEFVACLLSLLRQMTDRHYQQLLDSFNTKEELRDFLLQIFTVFRILIRPEMFPKDWTVMRLVANNVIITTVLYLSDALRKNFLNENFDYKIWDSYFYLAVIFINQLCLQLEMFTPSKKKKVLEKYGDMRVTMGCEIFSMWQNLGEHKLHFIPALIGPFLEVTLIPQPDLRNVMIPIFHDMMDWEQRRSGNFKQVEAKLIDKLDSLMSEGKGDETYRELFNSIIPLFGPYPSLLKKIERETWRESGVSLIATVTRLMERLLDYRDCMKMGEVDGKKIGCTVSLLNFYKTELNKEEMYIRYIHKLYDLHLKAQNFTEAAYTLLLYDELLEWSDRPLREFLTYPMQTEWQRKEHLHLTIIQNFDRGKCWENGIILCRKIAEQYESYYDYRNLSKMRMMEASLYDKIMDQQRLEPEFFRVGFYGKKFPFFLRNKEFVCRGHDYERLEAFQQRMLNEFPHAIAMQHANQPDETIFQAEAQYLQIYAVTPMPESQEVLQREGVPDNIKSFYKVNHIWKFRYDRPFHKGTKDKENEFKSLWVERTSLYLVQSLPGISRWFEVEKREVVEMSPLENAIEVLENKNQQLKTLISQCQTRQMQNINPLTMCLNGVIDAAVNGGVSRYQEAFFVKEYILSHPEDGEKIARLRELMLEQAQILEFGLAVHEKFVPQDMRPLHKKLVDQFFVMKSSLGIQEFSACIQASPVHFPNGSPQVCRNSAPASMSPDGTRVIPRRSPLSYPAVNRYSSSSLSSQASAEVSNITGQSESSDEVFNMQPSPSTSSLSSTHSASPNVTSSAPSSARASPLLSDKHKHSRENSCLSPRERPCSAIYPTPGEPSQRMLFNHIGDGGASPRSDPNLSAPEKASPARHTTAVSPSPAGRSPLKGSVQSFTPSPVEYHSPGLTSNSPVLSGSYSSGISSLSRCSMSETSGFENQVNDQPAPATVPGYSGPEEPARKESKTPPPYSVYERTLRRPVPLPHSLSIPVTPEPPALPPKPLAARAGHLENGTRRTEPGPRPRPLPRKVSQL +>XP_012927884.1_PREDICTED:_extensin-like +MLVVPLTAALLALSSAQSSYKGRGEGCELSGPPPPGNQQGPPQQGGPQNHSPHSINKQGPPRPGPQQPNGLPPPPLPPGKPQSPPPPEGPQNRPPHSLYKQGPPLPGGPQQPNRPPDTGNQQGPPQEEGLGFFISYLYFSTVHDTYEMKNPNPKNQAHTPKVRYPYFSTIHDTFEMKNPNTKNHARNPNVRYLYFSKIQCTYENKNPNPKNRTHTPIVSAIPDTYEKKIPNPKENTHTPNVRYLYFSTVHDTYEMKSPKPKNHAHTPNVRYMKRKPKLKHNPNFNSNPKKQDQKPVTSTVHDTYKMKNPKSKNHAHTPNVRYLYFSTINDNFEKKNPNHDNHIHTANISYMN +>XP_012929119.1_PREDICTED:_sarcosine_dehydrogenase,_mitochondrial_isoform_X5 +MASLNRALLVATACPRWRPAQRLGLQALAGAAGPKAEKNVPYQRTLKEEAQGPGAASRGPSQPLPSTASVVVIGGGSVGCQTLYHLAKLGVAGAVLLERERLTSGTTWHTAGLLWQLRPSDVEVELLAHTRRVVSRDLEEETGMHTGWIQNGGLFIASSRQRLDEYKRLMSLGKAYGVESHVLSPAETKVLYPLMKVDDLYGTLYVPQDGTMDPAGTCSTLARAAVARGARVIENCTVTGIRVRTDDFGVRRVAAVETEHGSIQTPCVVNCAGVWAGAVGRMAGVKVPLVAMHHAYVVTERIEGIQNMPNVRDHDASVYLRLQGDALSVGGYEANPIFWEEVSDKFTFGLFDLDWDVFTQHIEGAINRVPVLETTGIKSTVCGPESFTPDHKPLMGEAPELRGFFLGCGFNSAGMMLGGGCGQELAHWVMHGRPEKDMYSYDIRRFHPSLTAHQRWVRERSHESYAKNYAVVFPHDEPLAGRNMRRSLLHEELLGQGCVFQERHGWERPGWFSPQGPAPVLEYDYYGAYRKRPHRDYAYARLLADEYTFSFPPQHHVGAEAPTQHQGPGRRGAPRSVLVPGNSGHPGPVAEKMSVSPGNRPRFPSPGHASSHAGCDVAALEGKVPSVPTLSPRLAPWLQSARVRETEAEALCLVSAAAVQGGPGCVWHLSSRCSESCAAPALRGAEARGRRQLGTGVSQPPQMCPRQPPARGARSLSVLAASPACRRRRQSQGWSAAQRAAVGPLAPGTRWVLGKGCQCLEGGCRGARAWASEGPRPGGCVHQLPGVGRPLAPPI +>XP_004873590.1_PREDICTED:_pre-rRNA-processing_protein_TSR2_homolog +MMAGAGEAVRTLFRAGVRVVLEAWPALKIAVENGFGGVHSQEKAEWLESAVEDYFICNADLELDEVEDFLEELMTNEFDTIVEDGSLPQVSQQLQTMFHHFQRGDGAALKEMASHITQRKCRATALKTARETNEDEDDADSVEEMEVTATNDVAALQPETSDSNSQTIKEEDIVEDGWTIVRRKK +>XP_004854472.1_PREDICTED:_calcium/calmodulin-dependent_protein_kinase_type_II_subunit_alpha_isoform_X1 +MATITCTRFTEEYQLFEELGKGAFSVVRRCVKVLAGQEYAAKIINTKKLSARDHQKLEREARICRLLKHPNIVRLHDSISEEGHHYLIFDLVTGGELFEDIVAREYYSEADASHCIQQILEAVLHCHQMGVVHRDLKPENLLLASKLKGAAVKLADFGLAIEVEGEQQAWFGFAGTPGYLSPEVLRKDPYGKPVDLWACGVILYILLVGYPPFWDEDQHRLYQQIKAGAYDFPSPEWDTVTPEAKDLINKMLTINPSKRITAAEALKHPWISHRSTVASCMHRQETVDCLKKFNARRKLKGAILTTMLATRNFSGGKSGGNKKNDGVKKRKSSSSVQLMESSESTNTTIEDEDTKVRKQEIIKVTEQLIEAISNGDFESYTKMCDPGMTAFEPEALGNLVEGLDFHRFYFENLWSRNSKPVHTTILNPHIHLMGDESACIAYIRITQYLDAGGIPRTAQSEETRVWHRRDGKWQIVHFHRSGAPSVLPH +>XP_004852280.1_PREDICTED:_calcium-binding_protein_2_isoform_X1 +MVQGPMGNCAKRPWRRGPKDPWQWPGSPRGGSCCSASPRPKEQGGVQGYSVLGSLVGPACIFLRPNIATTQLDRDLRPEELEELQVAFQEFDRDRDGYIGYRELGACMRTLGYMPTEMELIEISQQISGGKVDFEDFVELMGPKLLAETADMIGVRELRDAFREFDTNRDGCISLGELRAALKALLGERLSQREVDEILQDIDLNGDGLVDFEEFVRMMSR +>XP_004871914.1_PREDICTED:_elongation_of_very_long_chain_fatty_acids_protein_1_isoform_X1 +MRKWQAGWPWGLLSGPAPSEPSTAAHLAPAESLARMEAVVNLYQEMMKYTDPRIQNYPLMGSPLLMTSILLTYVYFVLSLGPRIMANRKPFQLRGFMIVYNFSLVALSLYIVYEFLMSGWLSTYTWRCDPVDYSNSPEALRMVRVAWLFLFSKFIELMDTVIFILRKKDGQVTFLHVFHHSVLPWSWWWGVNIAPGGMGSFHAMINSSVHVVMYLYYGLSALGPVAQPYLWWKKHMTAIQLIQFVLVSLHITQYYFMPSCNYQYPVIIHLIWMYGTIFFVLFSNFWYQSYTKGKRLPRVLQQNGTPGITKVKAN +>XP_012926876.1_PREDICTED:_keratin-associated_protein_26-1_isoform_X2 +MSCRNSCSGNCSSESPRNSCHVPLNPAVALCSTSPAGCVSSGSVSSGYRPILCFSSPGRPLSVLPYGCQPSGSVVYRPQTVHVVSSGLRPVQPLSSGCQPLTSVVSPCHASCSAQGAQ +>XP_004863648.1_PREDICTED:_TAR_DNA-binding_protein_43_isoform_X1 +MSEYIRVTEDENDEPIEIPAEDDGTVLLSTVTAQFPGACGLRYRNPVSQCMRGVRLVEGILHAPDAGWGNLVYVVNYPKDNKRKMDETDASSAVKVKRAVQKTSDLIVLGLPWKTTEQDLKEYFSTFGEVLMVQVKKDIKTGHSKGFGFVRFTEYETQVKVMSQRHMIDGRWCDCKLPNSKQSPDEPLRSRKVFVGRCTEDMTADELRQFFSQYGEVEDVFIPIPFRAFAFVTFADDQVAQSLCGEDLIIKGISVHISNAEPKHNSNRQLERSGRFGGNPGGFGNQGGFGNSRGGGAGLGNNQGSNMGGGMNFGAFSINPAMMAAAQAALQSSWGMMGMLASQQNQSGPSGNNQSQGNMQREPNQAFGSGNNSYSGSNSGAAIGWGSASNAGSGSGFNGGFGSSMDSKSSGWGM +>XP_012928539.1_PREDICTED:_macrophage_erythroblast_attacher_isoform_X2 +MVVAELEKTLSGCPAVDSVVSLLDGVVEKLSVLKRKAVESIQAEDESAKLCKRRIEHLKEHSSDQPAAASLWKRKRMDRMMVEHLLRCGYYNTAVKLARQSGIEDLVNIEMFLTAKEVEESLERRETATCLAWCHDNKSRLRKMKSCLEFSLRIQEFIELVRQNKRLDAVRHARKHFSQAEGSQLDEVRQVMGMLAFPPDTHISPYKDLLDPARWRMLIQQFRYDNYRLHQLGNSSVFTLTLQAGLSAIKTPQCYKEDGSSKSPDCPVCSRSLNKLAQPLPMAHCANSRLVCKISGDVMNENNPPMMLPNGYVYGYNSLLSIRQDDKVVCPRTKEVFHFSQAEKVYIM +>XP_004855850.1_PREDICTED:_nodal_modulator_3_isoform_X2 +MRAGRGAGPVGVAAAVLLLLSGVGPARGSEDIVVGCGGFVKSDVEINYSLIEIKLYTKHGTLKYQTDCAPNNGYFMIPLYDKGDFILKIEPPLGWSFEPTNVELYVDGVNDICTKGGDINFVFTGFSVNGKVLSKGQPLGPSGVQVSLRNTGTEAKIQSTVTQPGGKFAFFKVLPGDYEILATHPTWALKEASTTVRVTNSNANAAGPLIVAGYNVSGSVRSDGEPMKGVKFLLFSSLVTKEDVLGCNVSPVPGFQAQDESLVYLCYAISKEDGSFSFHSLPSGGYTVIPFYRGERITFDVAPSRLDFTVEHDSLRIEPVFHVMGFSVTGRVLNGPEGEGVPEAVVTLNNQIKVRTKADGSFRLENITTGTYTIHAQKEHLYFETVTIKIAPNTPQLADIIATGFSVCGEVSITRLPDTAKQMSKYKVVLSSQDKGKSLVTVETDAHGSFCFKAKPGTYKVQVVIPEAETRAGLLLKPQTFPLTVTDRPVMDVAFVQFLASVSGKVSCLDTCGDLLVTLQSVSRQGEKRSLQLSGKVNSMTFTFDSVLPGKYKISIMHEDWCWKNKSLEVEVLDDDVSAVDFRQTGYMLRCSLSHAITLEFYQDGNGAENVGIYNLSKGVNRFCLSKPGVYKVTPRSCHRFEQAFYTYDTSSPSILTLTAIRHHVLGTLTTDKMMDVTVTIKSSIDSEPALVLGPLKSAQELRREQQLVEIETRRQEREKNGKEEGGEGRTKPPGQEMVDELQGPFSYDFSYWARSGEKITVTPSSKELLFYPPSVEAVVSGESCPGRLIEIHGKAGLFLEGQIHPELEGVEIVISEKGASSPLITVFTDDKGAYSVGPLHSDLEYTVTSQKEGYVLTAVEGTIGDFKAYALAGVSFEIKAEDDQPLPGVLLSLSGGVFRSNLLTQDNGILMFSNLSPGQYYFKPMMKEFRFEPSSQMIEVQEGQNLRITITGYRTAYSCYGTVSSLNGEPEQGVAVEAVGQKDCSIYGEDTVTDEEGRFRLRGLLPGCVYHVQLKAEGNDHIERALPHHRVIEVGNNDIDDINIIVFRQINQFDLSGNVITSSEYLPTLWVKLYKSENLDNPIQTVSLGQSLFFHFPPLLRDSELIPLLWQLSSRLQGVRALGQAAPDSSGPEDAKRQAKKQKTRRT +>XP_004848491.1_PREDICTED:_homeobox-containing_protein_1_isoform_X3 +MLSSFPVVLLETMSHYTDEPRFTIEQIDLLQRLRRTGMTKHEILHALETLDRLDQEHSDKFGRRSSYGGSSYGNSTHNVPASSSTATASTQTQHSGMSPSPSNSYDTSPQPCTTNQNGRENNERLSTSNGKMSPTRYHANSMGQRSYSFEASEEDLDVDDKVEELMRRDSSVIKEEIKAFLANRRISQAVVAQVTGISQSRISHWLLQQGSDLSEQKKRAFYRWYQLEKTNPGATLSMRPAPIPIEDPEWRQTPPPVSATPGTFRLRRGSRFTWRKECLAVMESYFNENQYPDEAKREEIANACNAVIQKPGKKLSDLERVTSLKVYNWFANRRKEIKRRANIAILESHGIDVQSPGGHSNSDDVDGNDYSEQDTWQVRNGEEEEGRSSEGGREAEKDDSMSHSDHQDPISLAVEMAAVNHTILALARQGTNEIKTEALDDD +>XP_004846770.1_PREDICTED:_Fanconi_anemia_group_E_protein_isoform_X1 +MATPEGAPPGAEGAGPEPWAPLEAPARLLLQALQAGSDGARRGLGVLRALGRRDGDPFSWGDLLGALCREEPALRGPGGPLELRPLLLRLPQFCQRNLLSLLMAVRPSMPESQLLPVLRIARQDRVSAPDAWLQALGRLLQRDLGPGVSLEGASVLSEGCRAQLRSLCRRLGQGGRRLKLPRAPDLEEEEDRESQQCGKRRQRPGEETGNPEGEKAPKRFRSGEREEEEDDHKERPGALSLESLVAGGAASPLRKEPLVMGAGPCGACQSPGEAEGRWASVELPGALQAQVPRLQQLLRTFGEGLGGLGDTPPKELQLLHECSPGQVEQLCAQLQLPQLSDASLLQLCTWLLALSPGLSISNATVLARSLFLGRVLSLTSSASRLLRTALTSFCASYPYPVCSALLGTVLQAPGTGPAQTELLCHLMKDESLEPDAQALMLGLHLSGPGLPSSPVPPQASGLAPCEALQNGDLRLSPAPGLCGVGAGCPGLVRGQAVLTRPLLCRQILELSWKEETFLVLQALLERQVEMTPEKLSVLMEKLCKEGLAATASVAYAKLMLTVMTKYQASITETQRLGLAGALETHTTFLRKSLQAALRRLAR +>XP_004846526.1_PREDICTED:_39S_ribosomal_protein_L14,_mitochondrial_isoform_X1 +MTFHSGQHPETLTYEEDLPLWDPMAASPALCGPLACVIRALGWHAFSTTGSIDAIQKLTRVRVVDNSALGNTPYHRPPRCIHVYNKSGVGKVGDRILLAIRGQKKKALIVGHRMPGPRMTPRFDSNNVVLIEDNGNPVGTRIKVPVPTSLRRKEGEYSKVLAIAQNFV +>XP_004866898.1_PREDICTED:_zinc_finger_protein_473 +MEEKEEELKKSHWAQATMMEEFATHDMGMDFTLEDWEQPGLDQGDLFWDTALDNYQNLPMLNPPRPSPTSHPDGEEELVALMRGSPEGMGPGMSETKNSPLKQNFLEEGLSQGIMEVFYKDDPWNSRLEVCLDESWLDNLQRDPESLQKSDDVTNNESTTESSSHELSHLSPCLLSIGEDSVTGVTEKSLTLAESKEYRSDFAYSPDQRQQDVVLGEEKPYKCSECEESFSHGNDLIQHWVTHIREEPSEHQEDQRDFSLTSYLSVCPVTHRGYRSYICKECGKTFSQNMQLQRHQKIHSREKPCKSQGGNCPSSYHGEPIKHQKTPRSPKSYKCNKCDMTFTQALHLIGHRKTHTRKHYECVTCQAVFTLRKHFIQHQKTHAVKTTSECQECGKTFKRRLSLIKHQAIHTGEKPYKCDECGKGFSHTSTLKIHQKVHSRERPYKCSDCSKAFSWKTHLHEHQQVHTGSRPHKCQECVRSFSRPSHLIRHQATHAMERLFGCAECSQTFSNKEYLVRHQKIHTIEAPYECLECGECFVCNSTLNCHLSVHAREKQRFDGTRKVLDQNLGQREHPRPDEKHFKCDKCGKAFNRNRYLTQHKKIHTRVQVFECNQCGKAFSQRTQLLCHQTVHSGKRPHECGEDEEVVLRTSLTRHQPSQSEHPFKCNECGNTFSQSTHLSEHQLIHTTKKPFKCNECERVFTQSNYLVQHQKAHVTKKHFLCSECGKMFHQSSCFSKHLRTHTGEKPFECGECGKAFGMNAELIRHRRVHTGEKPYLCQDCGKAFSQSSCLSIHRRVHTGEKPYLCSECGKAFTQRANLTQHERIHTGEKPYACGVCGKAFGFSAHLTQHQRSHTQEKPYQCQHCQKAFKCFFTLIRHQRVHARK +>XP_012926773.1_PREDICTED:_protein_C-ets-2_isoform_X2 +MNDFGIKNMDQVAPVANSFRGTLKRQPAFDTFDGSLFAVFPSLNEEQTLQEVPTGLDSISHDSASCELPLLTPCSKAVMSQALKATFSGFQKERRRLGIPKNPWLWSEQQVCQWLLWATNEFSLVNVNLQRFGMNGQVLCDLGKERFLELAPDFVGDILWEHLEQMIKENQEKAEDQYEENSHLNSVPQWVNNNTLGFGVEQSPYGMQTPSYPKGGLLDALCPSSTAPGVLSSEQDFQMFSKSRLSTVSGNYCSVGQDFPGGNLNLLASSTGKPKDHNSPKNGGDSFESSDSLLRSWNSQSSLLDVQRVPSFESFEDDCSQALCLGKPTISFKDYIQERSDPVEQGKPVIPAAVLAGFTGSGPIQLWQFLLELLSDKSCQSFISWTGDGWEFKLADPDEVARRWGKRKNKPKMNYEKLSRGLRYYYDKNIIHKTSGKRYVYRFVCDLQNLLGFTAEELHAILGVQPDTED +>XP_004867383.1_PREDICTED:_arylsulfatase_E +MPRPDRFGRCLPAVLTLFLAVKVSTCGEGPGSRPNILLLMADDLGLGDVGCYGNTSIRTPNIDQLAADGVKLTHHIAAASVCTPSRAAFLTGRYPIRSGMISYNGYRVLQWTGVAGGLPPSEITFAKILKEKGYTTGLIGKWHLGLNCKSPSDHCHHPLNHGFDHFYGMPFTMMGDCTGWELSERRVGLQRRLDFYFQVLAFAALTLAAGKLSHLLPVSWVPTLSITVLAATVFTTSYFLGDLLVHADCFLMRNHVITEQPMRFEKTTSLLLKEAESFLKRNKQGPFLLFVSFLHVHAPLITGKEFLGQSRHGLYGDNVEEMDWMVGRILGCLEEEGLSDSTLVYFTSDHGGSLESQLGSHQYGGWNGIYKGGKGMGGWEGGIRVPGLFRWPGVLPAGRVIREPTSLMDIFPTVVELAGGQVPRDRAIDGQDLWPLLLGSTPHKHLLPHHEVLFHYCEHLLHAARWHQRDRGRVWKVHYMTPIFQPEGAGACYGRQVCPCSGENVTTHDPPLLFDLTRDPGERQALTPDTEPEFHAVVSRVQREVDRHRQGLLRSVFQQLGTYLNTWRPWLQPCCGTFPLCWCCPEDEPREDPQ +>XP_004866767.1_PREDICTED:_lysophospholipid_acyltransferase_7 +MSPEEWTYLVVLLISIPIGFLFKKAGPGLKRWGAAAVGLGLTVFTCGPHTLHSLITMLGTWALIQAQPCSCHALALAWTFSYLLFFRALSLLGLPTPTPFTNAVQLLLTLKLVSLASDVQDLHLAQRKEMASGFSKAPTLGLLPHVPSLMETLSYSYCYVGIMTGPFFRYRTYLDWLEQPFPEALPSLRPLLCRAWPAPLFGLLFLLSSHLFPLEAVREDAFYARPLPTRLFYMIPVFFAFRMRFYVAWIAAECGCIAAGFGAYPVAAKARAGGGPTLQCPPPSSLEKAAALEYDYETIRNIDCYNTDFCMRVREGMRYWNMTVQWWLAQYIYKSAPASSYVLRSAWTMLLSAYWHGLHPGYYLSFLTVPLCLAAEGCLESALWGRLSPRGQKVWYWVHWFLKMRAYDYMCMGFVLLSMGSTLRYWASVYFCVHILAGACLGLGLALGGGRRSLRKTASESQAASTAPEKLREE +>XP_012930806.1_PREDICTED:_uncharacterized_protein_KIAA1614_homolog_isoform_X6 +MEGTEAAAEPAGGSPQKPKTGSRITSPVQVTSVVEGNDPEPQLDNGPLSRPWPFPPPKPPRLYRMQLHGSSVLESKVRALKEKMTASKQGVSPTTHEQSSTKKSKCRQVKPGRVQISEDSSLPDAVEVPYAQKLTGGQLDSSVNKEEPRSNGGSRPLPSAPELECWNGQNPLSPEVVWILSDRERGLAPGPDSLPESPSQGITPGWPVGPGPCKITCIPNLRKGRSDPLQDALVTVGDLDSTSLIPEEAFVPRTALLGTLWKARDLGTLGTGGNPLSLSDQVERNRLLLQEMLKVAEQSPPKTAPPAWTPSWNRTAPERSAGDVGWESGIFLQDSEQNRTFGPKPEAVLSTRHEEAKHLLQHPRMKARTRPLRASHDIVPAIAQGSRDGRRSPALGPRMTLACRDSPQSGSLSDSSSGESGSGQWPKQGMSTSHVRFEDEPAFEAEFRHLKRLQQRQRQVLSTELQAVGQGPLRSKPDLADYINQKVGMGAFHRLGDSRDCRGLPLPPPSWASERKYQECGLCPDSQCPDPRVPQELQAARGVEGVLHVSHSSSILSSPFRLLLADPGLDTERLRGTHIGETTTCPEEGDSALNSADTSDGCQTGSEEARTSLPIKASRQTQGSSPRQWDSRPQGGLGQSRKVKTELHGGLPACHSLGVEDTEVGDEVKEITGYTPVGTQFLKEDAIPKPPALEPEMAALESQRQPGSGLGSHQAHPVDPWAPCKLPYATTSSLKLAPSEPGIADQVTESHEYLETIHTSSLQQNHAQPAAPNRTQHPATSPSPEAWVASRTTSPVPHRKAGLAGPCRPGEQEEPVGNPLPLPPPRTPLRTCGLSSPQTQPCIPQARHPLLGLSANCNSCIPLGQQEPWGTAVYRGREKRVPCSQKPDPPLESSRDGGCQCSLGLADVAVFNSVGITLSLTSEEPESCQEAEEGLQRMESSSGSHMLSGASPGASAGPRPPLAAPSDSNKKRSSSIASTLGLKKLFSALGQASRPKLGKSRSYSVEHLQPDAPGSASHTSTHKVKRAPSLQSFHLVSPSRQHRKAASFQNLHSLLSGRGDRSSLYLVEGPGYPSAPGRPAKAPPRRALSVEDVGVPSLARTVGRVVAVFPDGTSQLQLQRSPEGTFGFRVGSGNGRRDSGRVS +>XP_004860505.1_PREDICTED:_replication_initiator_1_isoform_X1 +MLERRCRGPMAMGPAPPRLLSGPSQESSQTLEKESSRLSHRGTPVAQPGGQAPSKAHRCAHCRRHFPSWVALWLHTRQCQARLPLPCSECGHRFRHAPFLALHRQVHAAATSDLGFTCHLCGQSFRGWVALVLHLRVHSVAKRPIACPECERRFWQQKQLRAHLRKRHPPAPEVRPFICGNCGRSFAQWDQLVAHKRVHVAEALEEAAAKALGPRPRGRPAVTAPHPGGDAVDRPFQCACCGKRFRHKPNLIAHRRVHTGERPHQCPECGKRFTNKPYLTSHRRIHTGEKPYPCSECGRRFRHKPNLLSHSKIHKRSEGCPQAASGTRSAQVPAAAAEPSTELHPEKPTPEAAEPTPEVPLEPPRDQAEAPQSLYSCDDCSRSFRLERFLRAHQRQHSGERPFACPECGKNFGKKTHLVAHSRVHSGERPFACEECGRRFSQGSHLAAHRRDHAPERPFVCPDCGKAFRHKPYLAAHRRIHTGEKPYVCPDCGKAFSQKSNLVSHRRIHTGERPYACPDCDRSFSQKSNLITHRKSHIRDGAFCCAICGQTFDEEERLLTHQKKHDV +>XP_004842604.1_PREDICTED:_putative_ribonuclease_isoform_X1 +MFHLNSFKGLDVLPEMSLVIRNLQRAIPIRRVPLRRNVEIVRNILGVEKFDLGIICLDNKNIQHINGIYRKKNVPTDVLSFPFHEDLKAGEIPQPGFPDDYNLGDIFLGVEYIFQQCKENEDYCDILTGFLVTWNRASQKTQCEGCDLSPECSFPGQGRAHCTDMEKEVADIVPERDRKYPSTRFRPGISLASSYVSPGKGWSWTSGSTAPAP +>XP_012923981.1_PREDICTED:_ERI1_exoribonuclease_3_isoform_X3 +MATASPAADGGRGRPWEGGLVSWPPAPPLTIPWTWLGPSWGQHPGHWGFPALTEPSPSPAASLGIFEVRRVLDASGCSMLAPLQTGAARFSSYLLSRARKVLGSHLFSPCGVPEFCSISTRKLAAHGFGASMAAMVSFPPQRYHYFLVLDFEATCDKPQIHPQEIIEFPILKLNGRTMEIESTFHMYVQPVVHPQLTPFCTELTGIIQAMVDGQPSLQQVLERVDEWMAKEGLLDPNVKSIFVTCGDWDLKVMLPGQCQYLGLPVADYFKQWINLKKSPEEGVTEFCWKSSDGIQKGPWTWVCAEHGEYTVETSVGLQLRHGLLAQERTSRHEQGPQPAAHRPAPQRHR +>XP_004868768.1_PREDICTED:_sterol_regulatory_element-binding_protein_1_isoform_X1 +MDEPTFNEAALEQALTEPCELDAALLTDIEDMLQLINNQNSDFPGLFDPPYAGAGAGDTDPASPGACSPSSLSPPLSLSSPLEALLGGSKATPPPSSPPQSVLTPLKMFSSVSPFSPGHGIKEELVPLTILQPPTLPSPARQPPIPQPLPPLLPQSFPAPAPPQFNSTPVLGYSSSPGGFVAETPSGSAQPPLLGLPLASPTGVIPTSFHAPVQSMAPQQLLTATAAPGTTTVTSQIQQVPVLLQPHFIKADSLLLTTMKTDVGATVKATGISSLAPGTAVQTGPLQTLVSGGTILATVPLVVDADKLPINRLAAGSKAPGSAQSRGEKRTAHNAIEKRYRSSINDKIVELKDLVVGTEAKLNKSAVLRKAIDYIRFLQHSNQKLKQENLSLRSAVHKSKSLKDLVSDCGSGENADVAMEGVKSEVVDTLTPPPSDAGSPSQSSPLSLSSRSSGSGGSGSDSEPDSPVIEDSQVKPEQLPSPHSRGMLDRSRLALCALVFLCVFYNPLASLLSGRGLPSPLDATSVHHSPGRAMLGAEGRDGPGWAQWLLPPLVWLGNGLLVLLSLAFLFVYGEPVTRPHSGPAVHFWRHRKQADLDLARGDFAQAAQQLWLALRALGRPLPTSHLDLACSLLWNLIRHLLQRFWVGRWLAGRAGGLQRDCALRADVRASARDAALVYHKLHQLHAMGKYTGGHLTAANLALSALNLAECAGDTVSMATMAEIYVAAALRVKTSLPRALHFLTRFFLSGARQACLAQSSSVPLTMQWLCHPVGHRFFVDGDWAVCSAPRESLYSLAGNPVDPLAQVTQLFREHLLERALNCVAQPSLSPSPGSADGDREFSDALSYLQLLNSCSDAAGTPACSFSISSSMAATTGTDPVAKWWASLTAVVIHWLRRDEEAAERLYPLVEQLPRALQETERPLPRAALHSFKAVRALLGCGKSESGLASLAICEKASGYLQDSLATTSTGSSIDKAVQLLLCDLLLVARTSLWQQQQPPTSAQVAQGASSGPQASALELRGFQRDLSGLRRLAQSFRPAMRRVFLHEATARLMAGASPTRTHQLLDRSLRRRAGPGSKGGAAELEPRPTRREHAEALLLASCYLPPGFLSAPGQRVGMLAEAARTLEKLGDRRLLHDCQQMLMRLGGGTTVTSS +>XP_004845523.1_PREDICTED:_NFAT_activation_molecule_1_isoform_X2 +MKSWFPRQQAPAGPLMALQLLGLLLVPWTLRLAGGQSVSHTGPAILVSLANMTVPFSCRITYPYTPEFKDFTVSYFHVDLQGQKSPEKQKACHPGQGTENKTYTLKCLINPRLPDASATGTYYCCVHWQSIIVKDGGTFILVRETKASSKEASHPVVPRPKMCQPTLAAHCRICLHGPAAPGDRSLRLHRERGRQPAPRPESSLPGEKAAV +>XP_012921725.1_PREDICTED:_zinc_finger_protein_543-like_isoform_X3 +MGETEAGNGSVHQNHPPRLGRRWRSPAPRSSASAMAAAQVAVTFEDVAVRFTQEEWEQLDLSKRTLYWEVMLETCGLLTAVGCPLSKSELIYQLEHSQDLWTATGVLFQSFYSGNSTKLNSMKPTLAYQSWPEGALVHDHQTEGASGDFLLGPHQGQDEPCEVQKRLRPGMEAPREKLPGNRSPGHDGMGSADSVCSRSVQEHISPDPATCICDSNMPAADPSIREGENSYKCKECGKVFKNERLLIQHKWIHTGVKRYECTECGKTFRKSTHLLQHHIVHTRERPYMCLECDKAFSRKSYLTQHQRTHSGEKPYKCSECGQAFAHRSTFVLHNRMHTGEKPFVCKECGKAFRDRRAFNRHNIFHTGEKPYQCSECGKAFNQRSYLTWHQQTHKGVKPFQCNECGRGFCEIAGLIHHYVIHTGEKPYKCVECGKAFLREPHLKQHQRIHTGEKPYVCSECGKAFAHYSTLTLHRRAHTGEKPFECKECGKAFTNRKDLIRHVSIHTGEKPYECMECGKAFNRRSHLIRHHRIHNEEKPYKCMECGKTFSRSTNLIQHSNIHTGDKPYKCNECGKAFSLSSSLRYHQRMHTGKIAASVRDEGKPFTSVQASVNIEGLILGKNFLHITTDEHQCSRESSNTDSGHSYHRETGLVASLLKKCK +>XP_004869294.1_PREDICTED:_cytochrome_c_oxidase_assembly_factor_7 +MAGLVDFQDEEQVKSFLKNMEVECNYQCYQEKDPEGCYRLVDYLEGIQKNFDEAAKVLKFNCEDNKHSDSCYKLGAYYITGKGGLTQDLKAAFSCFLMACEKPGKKSVEACHNVGLLTHSGKVNEDGQPDLGKARDYYAKACDGGFAPSCFNLSAMLLQGAPGFPKDMALACKYSMKACDLGHIWGCVNASRMYKLGDGVDKDEAKAEVLKDRARQLHKEQQKSVQPLTFG +>XP_012931504.1_PREDICTED:_ankyrin-1_isoform_X2 +MAQAAKQLKKIKDIEAQALQEQKEKEESNKKRRNRSRDRKKKADAATSFLRAARSGNLDKALDHLRNGVDINTCNQNGLNGLHLASKEGHVKMVVELLHKEIILETTTKKGNTALHIAALAGQNEVVRELVNYGANVNAQSQKGFTPLYMAAQENHLEVVKFLLENGANQNVATEDGFTPLAVALQQGHENVVAHLINYGTKGKVRLPALHIAARNDDTRTAAVLLQNDPNPDVLSKTGFTPLHIAAHYENLSVAQLLLNRGASVNFTPKNGITPLHIASRRGNVIMVRLLLDRGAQIETRTKDELTPLHCAARNGHVRISEILLDHGAPIQAKTKNGLSPIHMAAQGDHLDCVRLLLQYNAEIDDMTLDHLTPLHVAAHCGHHRVAKVLLDKGAKPNSRALNGFTPLHIACKKNHIRVMELLLKTGASIEAVTESGLTPLHVASFMGHLPIVKNLLQRGASPNASNVKVETPLHMAARAGHTEVAKYLLQNKAKVNAKAKDDQTPLHCAARVGHTNMAKLLLESNANPNLATTAGHTPLHIAAREGHVDTALALLEKEASQACMTKKGFTPLHVAAKYGKARVAELLLERDAHPNAAGKNGLTPLHVAVHHNNLDIVKLLLPRGGSPHSPAWNGYTPLHIAAKQNQMEVARSLLQYGGSANAESVQGVTPLHLASQEGHAEMVALLLSKQANGNLGNKSGLTPLHLVAQEGHVPVADVLIKHGVTVDSTTRMGYTPLHVASHYGNIKLVKFLLQHQADVNAKTKLGYSPLHQAAQQGHTDIVTLLLRSGASPNEVSSNGTTPLAIAKRLGYISVTDVLKVVTDETSVVLVSDKHRMSYPETVDEILDVSEDEGTAHITIMGEDLVGSKAERQDSRDMDEERELLDFVPKLDQVVESPAIPRIPCVTPETVLIRSEEPEQASKEYDEDSLIPSSPATETSDNISPVASPVHTGFLVSFMVDARGGSMRGSRHNGLRVVIPPRTCAAPTRITCRLVKPQKLSTPPPLAEEEGLASRIIALGPTGAQFLSPVIVEIPHFASHGRGDRELVVLRSENGSVWKEHKSRYGESSLDQILSGMDEELGSLEELEKKRVCRIITTDFPLYFVIMSRLCQDFDTIGPEGGSLKSKLVPLVQATFPENAVTKKVKLALQAQPVPDELVTKLLGNQATFSPIVTVEPRRRKFHRPIGLRIPLPPSWTDNPRDNGEGDTTSLRLLCSVIGGTDQAQWEDITGTTKLVYANECANFTTNVSARFWLSDCPRTAEAVNFATLLYKELTAVPYMAKFVIFAKMNDPREGRLRCYCMTDDKVDKTLEQHENFVEVARSRDIEVLEGMPLFAELSGNLVPVRKAAQQRSFQFQSFRENRLAIPVKVRDSSREPAGFLSFLRKAMKYEDTQHILCHLNVTMPACTKGTGAEDRRRTLTPLALRYSGLSFPSGTDRADLKVAVITEHLGLSWAELARELQFSVEEINRIRVENPNSLWEQSAALLNLWAAQEGENAKMENLYAALRNIDRSEIVNMLEGSGRQSRNLKPDRRQADQDYSLSPSQMNGYSSLQDELLSPASLHYTLPSPLHADQYWNEVAVIDAIPLAATEHDAMLEMSDMQVWSSGLTPSLVTAEDSSLECSKAEDSDATQEWKLEGALSEESRGPELGSLDLVEDDTVDSDATNGHADLLGQEEGQRSEEKRQEDSAGAGQDSENEVSLVAGQQRVQVRTTDSPSMSRVLERNQDRPQDWDFEGSIAFYLQDAARGSWPEEATQGPHSFQTTTSTIQGSEHDTVLVSVGEHMWTAQPETQSSQAGREGGIRAARSTFLQVEQGNELQNIPGEQVTEEQFTDEQGNFVTKKTIRKVVRQIDSSGADDTQEHEEVIVGGPLEKDTSVLETDPDFITKLDKVELRGSSLQPDLLEGRKGAQIVKRASLKRGKQ +>XP_004855359.1_PREDICTED:_DNA_replication_complex_GINS_protein_SLD5 +MTEELDLAGPDSDAGSEEVVLTPAELIERLEQAWMNEKFAPELLESKPEIVECVMEQLDHMEENLKRAKKEDLKVSIHRMEMERIRYVLSSYLRCRLMKIEKFFPHVLEKEKTRPEGEPSSLSSEEFAFAKEYMAHTETYLKNVALKHMPPNLQKVDLLRAVPKPDLDSYVFLRVKERQENILVEPEADEQKDYVIDLEEGSQHLIRYRTIAPLVASGAVQLI +>XP_012933799.1_PREDICTED:_putative_bifunctional_UDP-N-acetylglucosamine_transferase_and_deubiquitinase_ALG13_isoform_X2 +MNNHQLQLAKQLHKEGHFFCCTCRILTCLGQAPPLASPALGKCQDSAGLTPAAFCLNFELLSGDLQAQALLPAPHSSLHPAASSFPHFCSFSPPSIPCTMHKGWKKYGGQKSLNETSMDEYLGSLGLFRKLTAKDASCLFRAISEQLFCSQVHHLQVRKACVTYMKENQQTFESYVEGSFEKYLQRLGDPKESAGQLEIRALSQIYNRDFILYRHPGKPPIYVTDNGYKDKIVLCYSSNGHYDSVYSKQFQSSAAICQAVLYEILYKDVFVMDEEALKTAVQLFRSGSKKNRNNAVTGSEDAHIDYKSSTQDRNEEWGAGCSIQNIPEGYNQGMEELKSPENPSKMLFPYKVLKALDPEIYRNVEFDVWLDSRKELQKSDYMEYAGRQYYLGDKCQVRLESDGKYYNAHIQEVGNENHSVTVFIEELAEKHVVPLANLKAVTQVTPVPTWNAMPSRKGRGYQKMSTGYVPEMAMPEMDIKQRKKMFKKVRGKEVYMTVAYNRGDSLPPPRLQHSMHYEHDPPLHYSQTGANVMCNEQFHHQHSSHRQGRGYGIPRDSSRFINRHSMPSPKVGFYSEPGKRCCQSFDNFSYRSRSFRRSHRQMHCMNKECHFGFAPENGQVPSGLEETVTFYEVEEGDTTAYPTLPNHGNPSMMVPATSGYCVGRRGHSSGKQTSNSEEGNGQSDNGRYEEYLYPSEPDYETSGVYSTTASTANLSLQDRRPCSSMSPQDAVTSYNYHQKMMGNSAVIAVSCASTVPAPVLPNCVTANQTTSASSVSSQNAIQPLFVPPPAQGRPVIASPSYQYHSAAIPAAASFPPPPPPPPPPPPPPPPPFEVEEASNLASQLPPYSCDPNGSDLPQDTKVLQYYFNLGLQCCHHNYWHSMVYVPHMQQPHVENYPIYTEPPPLMDQTVPNLYSEVARADGAQTEASANGTFANADSASIPHGAVYYPVMSDPYAQPPLPGFDSCLPVVPDYSCVAPCHPVAAAYGGSSQIHGAVNPGAVGYIASPPSSSHYVPQNM +>XP_012927209.1_PREDICTED:_two_pore_calcium_channel_protein_1_isoform_X1 +MAVNLDDDVPLILTMDEGCSAPAASSNSLGPEQLPSRNGGSHTIPDSRAPSLVSGGENSPASPTPHDWEMNYQEAAIYLQEGENNDKFFTHPKDAKALAAYLFAHNHVFYLMELLTALLLLLLTLCEAPAVPALRLGIYVHATLELFALMVVVCELCMKLRWLGLHTFVRHKRTMVKTSVLVVQFVEAIVVLVRQTSHVRVTRALRCIFLVDCRYCGGVRRNLRQIFQSLPPFMDILLLLLFFMIIFAILGFYLFSPNPSDPYFSTLENSIVSLFVLLTTANFPDVMMPSYSRNPWSCVFFIVYLSIELYFIMNLLLAVVFDTFNDIEKRKFKSLLLHKRTAIQHAFRLLTSQRRPSGISYRQFEGLMRFYKPRMSARERFLTFKALNQSNKPLLSLEDFCDIYEIATLKWKAKRNREHWFDELPRTAFLIFKGINILVQSKAFQYFMYLVVAVNGMWILVETFMLKGGNFFPKHVPWSYLVFLTIYGVELFLKVAGFGPVEYLSSGWNLFDFSVTVFAFLGLLALALNMEPFYFIVVLRPLQLLRLFKLKKRYRNVLDTMFELLPRMASLGLTLLIFYYSFAIVGMEFFCGLLYPNCCNTSTVADAYRWLNHTVGDKTVVEEGYYYLNNFDNILNSFVTLFELTVVNNWYIIMEGVTSQTSHWSRLYFMTFYIVTMVVMTIIVAFILEAFVFRMNYSRKSQDSEVDGGITLEKEISKEELVAILELYRGARGASSSVTQLLETLSQMEKYQQNSLVFLGRRSRTKSDLSLKMYQEEIQEWYTEHAREQEAQRQQLSSSGTVPTTQQPPGSRQRSQTIT +>XP_012923705.1_PREDICTED:_S_phase_cyclin_A-associated_protein_in_the_endoplasmic_reticulum_isoform_X3 +MMMNTAVDCKITSVVGDKNFDKSPTKTRHPRKIDLRARYWAFLFDNLRRAVDEIYETCESDQSVVECKEVLMMLDNYVRDFKALIDWIQLQEKLEKTDAQSRPTSLAWEVKKMSPGRHVIPSPSTDRINAASNARRSLNFGGSPGTVVAPCLAPAGVSWADKVKAHHTGSASSDTAPAQLCPPMAVQKVSRRNERKDAEGWETVQRGRPVRSRSTGVVPKVSLVPEALKLKKDDTNKENLCRLPEESIQKDDFFRDRSSNIVEPRPRDSFHSSDHPLAERTQFTVNTLDDVKNSGSSQDCSVQTYEIPAVHNDEECVSVTQQADIPPLRTNEENLLAEKERIENEMDPSDISNVSAAHLSMAEVLAKKEELADRLEKANEEAIASAIAEEEQLTREIEAEENNDINIETDNDSDFSASMGSGSVSFCGMSMDWNDVLADYEARESWRQNTSWGDIVEEEPARPPGHAIHMHEKLSSPSRKRTIAESKKKHEEKQMKAQQLREKLREQKTLKLQKLLEREKDVRKWKEELLDQRRRMMEEKLLHAEFKREVQLQAIVKKAQEEEAKVNEIAFINTLEAQNKRHDVLSKLKEYEQRLNELQEERQRRQVEKQARDEAVQERKRALEAERQARVEELLMKRKEQEARIEQQRQEKEKAREDAARERARDREERLAALTAAQQEAMEELQKKIQLKHDESIRRHMEQIEQRKEKAAELSSGRHANTDYAPKLTPYERKKQCSLCSVLISSEVYLFSHIKGKKHQQSVRENSSIQGRELSDEEVEHLSLKKYIVDIVVESSAPSEPVKDGEERQKNKKKAKRIKARMNSRAKEYESLIETKNCGSDSPYKAKLQRLAKDLLKQLQVQDSGSWLNNKVSALDRTLGEIARILEKENVADQIAFQVAGGLTALEHILQVAVPATNVNTVSRIPPKSLCSAISVYYLTCNNCSENCTDVLFSNKITFLMDLLTYQLTVYVPDENNAILGRNTNKQVYEGLTTGLLKVIAAVFGCLIANRPDGNSRPATPKISTQEMKNKPSQGDAFNSRVQDLISYVVSMGLIDKLCGCFLSVQGPVDENPKMATFLQHAAELLHGMCTLCFAVTRRSYSIFDSNRQDPTGLTAALQTTDLAGVLHMLYCILFHGTISDPSSASPKESYAQNTVQVAIQSLRFFNSFAVLDLPAFQSIVGAEGLSLAFRHMASSLLGHCSHVSCESLLHEVIVCVGYFTVNHPDNQVIVQSGRHPTVLQKLCQLPFQYFSDPRLIKVLFPSLIAACYNNCQNKVILEQEMSCVLLASFIQDFTQTPNQAEPQPHQPRGRCLGPQDYLELANRFPQQAWEEARKFFLKKEKN +>XP_004836777.1_PREDICTED:_mastermind-like_protein_1_isoform_X1 +MVLPTCPMAEFALPRHSAVMERLRRRIELCRRHHSTCEARYEAVSPERLELERQHTFALHQRCIQAKAKRAGKHRQPPAAPAPRLDAADGPEHGRPATHLHDTVKRNLDSTASPQNGEQQNGYGDLFPGHKKTRREALLGVALSANGLPPSSPLGQPDKPSAGEALQSGGKHSLGLESINKKCLADPSLHLNGGSNTGESFPLSLSKELKQEPVDDLPCMITGAGGSISQSNLMPDLNLNEQEWKELIEELNRSVPDEDMKDLFTEDFEEKKDPEPSGSATQTPLSQDINIKTEFSPAAFEQEQLGSPQVGAGPAGQSFPGPSSAPVRTDNPSASLMPASAQAQSAQRALTGVVLPGQGPGGAPELSSAHQLQQIAAKQKREQMLQNPPQAVPAPAPGQMSSWQQTGPSHSPLDVPYPIEKPASPAGYKQDFPSSQLLMMPGVNKSSPRPGAPFLQPGHVSLLSHQPQGNLSQNSVNNQGSVLDYGNTKPLSHYKADCGQGGPGSGQSKPALMAYLPQQLPHLNNEQNPLFLMKPKPGNMPFRSLVPPGQEQSPSSVPVPAQATSVGTQSPAVSVATTHSSAPYLSSQQQAAVMKQHQLLLDQQKQREQQQKHLQQQQQQQQFLQRQQQHLLAEQEKQQYQRHLTRPPPQYQDPTQSTFPPQVGQFTGSVSAVSGMNNLGSSNSSCPRVFPQPGNLMPMGPGHTSVSSIPSNSGPQDRGVAQFPGSQSMPQSSLYGMASGMTQMVAQPPPQAANGHAHISRQTSAGQTAAVPAAYGQNSLGSAGLSQQHNKGTLTSGLTKPPIPRVSAAIGGQNASWQHQGMPNLSSQTPGSSSVSPFTAASTFHIQQAHLKMSSPPFSPAMPSRPLAPMSSAAAAGSMLPPVSTQQRTSAPAPAPPQTAPQPGLPGLSPAGPELGPFSQSPASQMGSRAGLHCTQAYPVRTVAQELPFYSGQPGSSGLSGVAGHTDLIDSLLKNRTSEEWINELDNFLGSQ +>XP_004834988.1_PREDICTED:_oxysterol-binding_protein-related_protein_11_isoform_X1 +MQSGEPVSTMRVSESEGRLEALATAVTPSGKNSGAGAISGGGGGSRGGSAKGWQYSDHMENVYGYLMKYTNLVTGWQYRFFVLNNEAGLLEYFVNEQSRSQKPRGTLQLAGAVISPSDEDSHTFTVNAASGEQYKLRATDAKERQHWVSRLQICTQHHTEAIGKNNPPLKSRSFSLTSSGNSPISQRRPSQNAVSFFGVGHSKLQPGGRKAHLPPDHLVEVREMMSHAEGQQRDLVRRIECLPTSGLPSSLDQDLLMLKATSMATMNCLNDCFHILQLQHASHQKGSLPPGTTIEWLEPKIPLSNHYKNGAEQPFTAEQDKAVPVPEEQSAAESGLIALIAREPEDINSDEEVEDTCDDKEDDLGAVEEQRSVILHLLSQLKLGMDLTRVVLPTFILEKRSLLEMYADFMSHPDLFIAITSGASAEDRMVRFVEYYLTSFHEGRKGATAKKPYNPILGETFHCSWWVPKSSPGAPTGNAPNPAPEESASPAADCYTVRFVAEQVSHHPPVSGFYAECAERRMCVSAHVWTKSKFLGMSIGVTMVGEGVLSLLEHGEEYTFSLPCAYARSILTVPWVELGGKVGVSCAKTGYSASITFHTKPFYGGKLHRVTAEVKHNLSNTVVCRVQGEWNGILEFTYSNGETKCVDLTRLAVTRKRVRPLEKQDPFESRRLWRNVTEALSHAEMDKATEHKRALEERQRAEERLRAEAGAAWRTRYFTKEGDSWVYHKPLWKVLAAAQPAE +>XP_004852811.1_PREDICTED:_abhydrolase_domain-containing_protein_2 +MNAMMDTPELPAVFDGVKLAAVAAVLYVIVRCLNLKSPTAPPDLYFQDSGLSRFLLKSCPLLTKEYIPPLIWGKSGHIQTALYGKMGRVSSPHPYGHRKFITMSDGATSTFDLFEPLAEHCVGDDVTMVICPGIANHSEKQYIRTFVDYAQKSGYRCAVLNHLGALPNIELTSPRMFTYGCTWEFGAMVNYIKKTYPLTQLVVVGFSLGGNIVCKYLGETQANQEKVLCCVSVCQGYSALRAQETFMQWDQCRRFYNFLMADNMKKIILSHRQALFGDHIKKPQSLEDTDLSRLYTATSLTQIDDNVMRKFHGYNSLQEYYEEESCMRYLHRIYVPLMLVNAADDPLVHESLLTIPKSLSEKRENVMFVLPLHGGHLGFFEGSVLFPEPLTWMDKLVVEYANAICQWERNKSQCSDTEQVEAELE +>XP_004872457.1_PREDICTED:_Krueppel-like_factor_1 +MARAETALPSISMLTTLGPCPDTQEDFLKWWRLDEAQDLGPGPPDPMGPPLHVSPESEDAPGEDEDGDRDADAAWDLDLFLSSFPPPEPGGAPRTCALNTGEAPGAQYVPPSETLGAYPGGPGLVSGPLGPEEPAGWARAPDPFTAPGPGPEPKALALQPLYPGPGAASSGGFFPPAGLAVPAAPGAPYGLLSGYAPLYPAPQYQGHFQLFRGLRAPSSSPAAPPSFLGCLAPGTAGAGLVGTSTDPGVIAEVVPQKRSRRSWARKRQAAHTCAYPGCGKSYTKSSHLKAHLRTHTGEKPYACSWDGCGWRFARSDELTRHYRKHTGQRPFRCKLCPRAFSRSDHLALHMKRHL +>XP_004845279.1_PREDICTED:_endothelin_B_receptor +MQPPPSLRGLALVALVLACRSGRVWGEERGLPPAWATPTLLGTGETITPPTKTSLPRSFNSSLPESPAPAQVPKGRNTPGGPPRPHSAPSCHRNIEIKETFKYINTVVSCLVFVLGIIGNSTLLRIIYKNKCMRNGPNILIASLALGDLLHIVIDIPINVYKLLAEDWPFGVEMCKLMPFIQKASVGITVLSLCALSIDRYRAVASWSRIKGIGVPKWTAVEIVLIWVISVVLAVPEAIGFDMITMNYKGSHLRICMLHPVQKTAFMQFYKTAKDWWLFSFYFCLPLAITAFFYTLMTCEMLRKKSGMQIALNDHLKQRREVAKTVFCLVLVFALCWLPLHLSRILKLTLYDQNDPNRCDLLSFLLVMDYIGINMASLNSCINPIALYLVSKRFKNCFKSCLCCWCQSFEEKQSLEEKQSCLKFKANDHGYDNFRSSNKYSSS +>XP_004863717.1_PREDICTED:_GDH/6PGL_endoplasmic_bifunctional_protein_isoform_X7 +MLNPYTEPLHPGLWKMLTVAMCVALVGCLQAQELRGHVSIVLLGATGDLAKKYLWQGLFQLYLDEVGKDHSFSFHGAALTAPEQGWKLMAKALESLSCPSDMAPSHCAELKDQFLRLSQYRQLKTAEDYRTLSKDIEAQVKQEDLREAGRIFYFSVPPFAYVDIARNINSSCRPGPGAWLRVVFEKPFGHDHLSAQQLATELGSFFQEEEMYRVDHYLGKQAVAQILPFRDQNRKALDGLWNRHHVERVEIIMKETVDAEGRISFYEEYGVIRDVLQNHLTEILMLVAMELPLNVSSSAAVLQHKLEAFRGLRGLNKGSAVVGQYQAYSAQARRELQKPEGFHSLTPTFAGVLVHVDSLRWEGVPFTLMSGKALDERVGYVRVLFKNQAFCIQHERHWAPEQSPCLPRQIIFHIGHGELSHPAILVSRNLFRPSLPAHSWAEVQERPGLRVLGRPLSDFYAYSPLRERDAYSILLSHIFHGRKESFITTENLLASWDFWTPLLDSLAHEVPRLYPGGADTGCLLDLELNGGHLSFSQQQPEQLVPGPGSAPKPSDFQVLRARYRESPLISAWPEELISRLASDIEASALQAVQHFGKFHLALSGGSSPIALFQQLAMGHYSFPWAHTHLWLVDERCVPLSDPDSNFQGLQAHLLQHIRLPYYNIHPMPVHLHQRLCAEEDQGAQTYAGEISALVANSSFDLVLLGMGTDGHTASLFPQSPTGLDGEQLVVLTQSPFRPHQRMSLSLPLINRAKKVAVLVMGRTKRDITMLVSRVGQEPRKWPISGVLPSSGQLVWYMDYEAFLG +>XP_004860462.1_PREDICTED:_transmembrane_protein_176B_isoform_X2 +MTQNMVTVNGVSVASLPPQPTHINIHIHRESALTQLLKAVGSLKQLLSHPRDSGPSKARTSNEQLALGVKQILLGVVSCALGVSLYFGPRTELRVLGCAFWAGSVAIAAGAGAIVHEKHRGKLSGCVSGLLTLAGIAATVAAIVFCVRTLIWQTDDLNYKKFNSVCDRLVPVTTTTNYRWRNNNSDWRTENCRTLMKMTLHLFLGFCILLTVVCILNVIVSLASLGLHLRSMRGRSSEFLDEKESNQKLLRVNPVTPSTSKEETLTVINL +>XP_004839279.1_PREDICTED:_kanadaptin_isoform_X2 +MAETPSQSEPPASVELSDDFKKPTLPGSSAVRGKASAVSPANPEELTKECPTALPDLDSGEPDVLPLGPDGGETSSLLEQQLRPPTAVSSPGGPARGPQYQEPPWGGPATAPYSLETLKGGTILGTRSLKGASCCLFGRLSSCDICLEHPSVSRYHAVLQHRAPDPDGECDGHGQGFYLYDLGSTHGTFLNKTRIPPRTYCRVHVGHVFRFGGSTRLFILQGPEEDRETESELTVTQLKELRKQQQILLEKKMLGEDSDEEDMDTTERKGSASGQDDDMGCTWGMGEDAVEDEAEENPIVLEFQQEREAFYIKDPKKALQGFFDREGEELEYEFDEQGHSTWLCRVRLPVDDSTGKQLVAEAIHSGKKKEAMIQCSLEACRLLDTLGLLRQEAVSRKRKAKNWEDEDFYDSDDDTFLDRTGLIEKKRLNRMKKAGKIDEKPETFESLVAKLNDAEKELSEISERLKASSKGLSESASQDSLDAFMSEIKSGNALDGVSRKKLHLRTFELRKEQQRLKGLIKIVKPAEIPELKKTASQTADSGNKAKKLTLPLFGAMKGGSKFKLKTGTVGKLPPKRPELPPALMRMKDGPEVEEEEEEEEDEEKEKEEHERRMEDGSSGRLPELETEAAGQEMSVPAALTGSKEAKGGASKNEYESSTEELKKKKAPGPGRFLPTLSSKYPEDDPDYCVWVPPEGQSGDGRTHLNDKYGY +>XP_012922417.1_PREDICTED:_integrin-linked_kinase-associated_serine/threonine_phosphatase_2C_isoform_X4 +MVKHEGKGAKRKASEEEKNGSEELVEKKVCKGSSMIFGLKGYVAERKGEREEMQDAHVILNDITEECKPPSSLITRVSYFAVFDGHGGIRASKFAAQNLHQNLIRKFPKGDVVSVEKTVKRCLLDTFKHTDEEFLKQASSQKPAWKDGSTATCVLAVDNTLYIANLGDSRAILCRYNEESQKHAALSLSKEHNPTQYEERMRIQKAGGNVRDGRVLGVLEVSRSIGDGQYKRCGVTSVPDIRRCQLTPNDRFILLACDGLFKVFTPEEAVNFILSCLEDEKIQTREGKPAVDARYEAACNRLANKAVQRGSADNVTVMVVRIGP +>XP_004856471.1_PREDICTED:_metabotropic_glutamate_receptor_8_isoform_X1 +MVYEGKRSTSCPCFFLLTAKFYWILTMMQRTHSQEYAHSIRVDGDIILGGLFPVHAKGERGVPCGELKKEKGIHRLEAMLYAIDQINKDPDLLSNITLGVRILDTCSRDTYALEQSLTFVQALIEKDASDVKCANGDPPIFTKPDKISGVIGAAASSVSIMVANILRLFKIPQISYASTAPELSDNTRYDFFSRVVPPDSYQAQAMVDIVTALGWNYVSTLASEGNYGESGVEAFTQISREIGGVCIAQSQKIPREPRPGEFEKIIKRLLETPNARAVIMFANEDDIRRILEAAKKLNQSGHFLWIGSDSWGSKIAPVYQQEEIAEGAVTILPKRASIDGFDRYFRSRTLANNRRNVWFAEFWEENFGCKLGSHGKRNSHIKKCTGLERIARDSSYEQEGKVQFVIDAVYSMAYALHNMHKDLCPGYTGLCPRMSTIDGKELLGYIRAVNFNGSAGTPVTFNENGDAPGRYDIFQYQITNKSTEYKVIGHWTNQLHLKVEDMQWANREHPHPSSICSLPCKPGERKKTVKGVPCCWHCERCEGYNYQVDELSCELCPLDQRPNANRTGCQRIPIIKLEWHSPWAMVPVFIAILGIIATTFVIVTFVRYNDTPIVRASGRELSYVLLTGIFLCYSITFLMIAAPDTVICSFRRIFLGLGMCFSYAALLTKTNRIHRIFEQGKKSVTAPKFISPASQLVITFSLISIQLLGVFVWFVVDPPHTIIDYGEQRTLDPENARGVLKCDISDLSLICSLGYSILLMVTCTVYAIKTRGVPETFNEAKPIGFTMYTTCIIWLAFIPIFFGTAQSAEKMYIQTTTLTVSMSLSASVSLGMLYMPKVYIIIFHPEQNVQKRKRSFKAVVTAATMQSKLIQKGNDRPNGEVKSEVCESLDTNTSSTKTTYISYSNHSI +>XP_004845721.1_PREDICTED:_cytohesin-4_isoform_X2 +MDLCHPESAELSSRETEELQRIKWHRKQLLEDIQKLKDEIAEVFAQIDCFERAEDSRMAQKEKELCIGRKKFNMDPVKGIQYLTEHKLLPPCAQDIAQFLYKGEGLNKTAIGTYLGERDPLNLQVLQAFVDCHEFTNLNLVQALRQFLWSFRLPGEAQKIDRMMEAFAARYSLCNPGVFQSTDTCYVLSFSIIMLNTSLHNPNVRDRPPFERFVSMNRGINDGGDLPQEQLRNLFDSIKSEPFSIPEDDGSDLTYTFFNPDREGWLLKLGGRVKTWKRRWFILTDNCLYYFEFTTDKEPRGIIPLENLSVQKVDDPKKPFCLELYNPRCRGQRIKACKTDGDGRVVEGKHGSYRISAASTEERDQWIEAIQASITRVPFYDLVSARKKKIASKQ +>XP_012929023.1_PREDICTED:_nuclear_apoptosis-inducing_factor_1 +MAVPAKKRKMNFSEREVEIIVEELELKKHLLVNHFNAGVPLAAKSAAWHGILRRVNAVATCRRELPEVKKKWSDLKTEVRRKVAQVRAAVEGGEAPGSTEEDGAAGPGTGGSSGAGGPAVAPVLLTPMQQRICNLLGEATIISLPSTTEIHPVALGPAATAAAATVTLTQIPAETTYHALEEGVVEYCTAEAPPPLPAEAPVEMMAQHGDTSVKPQALKSRIALNSAKLIQEQRVTNLHVKEIAQHLEQQNDLLQMIRRSQEVQACAQERQAQAMEGTQAALSVLIQVLRPMIKDFRRYLQSHTPTPTPASDPGQVAQNGQPDSIIQ +>XP_004921092.1_PREDICTED:_LOW_QUALITY_PROTEIN:_putative_uncharacterized_protein_PQLC2L +MNVELYFTPYTKINSKRITGPYVSAKAITLLEENTGVNLHNLGQLFVTYKSGKVDEAVPLGFLLCRIGEDLINFVGCYLINXLPFQILTTIFCVNMDIIIVSQFTYYKVKELEEKM +>XP_004867364.1_PREDICTED:_granulocyte-macrophage_colony-stimulating_factor_receptor_subunit_alpha-like_isoform_X1 +MPGTLEATQGAAGPMPRGPRPAGSPGRFLPAALVLLLTLCLDPAAALAPELAEVEPAPRLSVTFNPKSRRLTWDCRENATDARCFMLHKEKGPIEIKPWGKACACTFNYAPLHGGVTFEVHATVRGRPVREELLYPNPGHEGTAARNFSCFIYDAGSLNCTWARGPAAPGDVQYFLFIENTKTQTEQECPLYSPDSGTHTGCHLRDLSALGFRNYFLLNGTSLAAPIQYFDSIWTAKEIERLSPPDNVTVYCNTSHCRIRWRPPQTWIPLTYKDFTYQLDIQRRHAGLGSGTPPVQVAGEAENEYCFPSPEPRARQAVRVRVADVRGGPWSAWSRPAAFGSDTRAGPALRLYVPVVLGTLVCALVLGFLFRRFVGLRALCPRVPQVKDKVSSVDGVAHQVPWEDFAPGIRKGELEDVLTVEEVS +>XP_004857450.1_PREDICTED:_eukaryotic_translation_initiation_factor_5A-1 +MADDLDFETGDAGASATFPMQCSALRKNGFVVLKGRPCKIVEMSTSKTGKHGHAKVHLVGIDIFTGKKYEDICPSTHNMDVPNIKRNDFQLIGIQDGYLSLLQDSGEVREDLRLPEGDLGKEIEQKYDCGEEILITVLSAMTEEAAVAIKAMAK +>XP_004852124.1_PREDICTED:_uncharacterized_protein_C11orf91_homolog +MPKVRRGSRSPRMSQRPAPPRYFPSLYDGGISSSPFKEFNIWEKLFEPLKAGGAPAGEEAGDGPLPQVPFALEPRPPPGVGPPGECPWPSGLASIPYEPLCFYSPPPGPEVAPSPTAPSPAGSPLASALHPEELCELEIQIKELELLDIIGDGFDSQRYKLLKALKDEKLQGLKTRPLGKKLALLS +>XP_004867779.1_PREDICTED:_melanopsin +MDTPSGPRVSPDPAQEPSFLATLSAPGRGDGTPSSLSTPGQLPPGNPTAAGTQAAVRVPFSTADVPAHVHYTLGAVILLVGLTGMLGNLTVIYTFFRSRGLRTPANMFVINLAVSDFLMSFTQAPVFFTSSLYKRWLFGEAGCEFYAFCGALFGITSMITLTAITLDRYLVITRPLATIGLASKRQAALVLLGIWLYALAWSLPPFFGWSAYVPEGLLTSCSWDYMTFTPSVRSYTMLLFCFVFFLPLLIIIYCYVFIFRAIRETGRAFESCGESPSRRRQWQRLRSEWKMAKIALLVILLFVLSWAPYSTVALVAFAGHAHILTPSMSSVPAVIAKASAIHNPIIYAIAHPKYRMAIVQHLPCLGLLLGVSGQRSLPSLSYRSTHRSRLSSQASDLSWISGRRRQESLGSESEVGWTDTEAWGSAQQASGRPPCGMGLEGWEARAHPKAQEWEAETPGKTKGRLPSLDPQM +>XP_004834437.1_PREDICTED:_plastin-1_isoform_X1 +MENSTTTISREELEELQEAFNKIDIDNSGYVSDYELQDLFKEASLPLPGYKVREIVEKILVVADNNKDGKISFEEFVSLMQELKSKDISKTFRKIINKREGITAIGGTSSISSEGTQHSYSEEEKVAFVNWINKALESDPDCKHLIPMNPNDGSLFRSLADGILLCKMINLSEPDTIDERAINKKKLTPFTVSENLNLALNSASAIGCTVVNIGAQDLKEGKPHLVLGLLWQIIKVGLFADIEISRNEALIALLNEGEELEELMKLSPEELLLRWVNYHLTNAGWNTINNFSQDIKDSRAYFHLLNQIAPKSDREDGPAIAIDLSGFNEKNDLKRAGFMLQEADKLGCRQFVTPADVVSGNPKLNLAFVANLFNTYPCLHKPDNNEIDINLLEGESKEERTFRNWMNSLGVNPYINHLYGDLEDALVIFQLYEMIRVPVNWNQVNKPPYPALGGNMKKIENCNYAVELGKNKAKFSLVGIAGQDLNEGNSTLTLALVWQLMRRYTLNVLSDLGEGEKVNDEIIIKWVNQTLKNANKNTSISSFKDKSISTSLPVLDLIDAIAPNAVRQEMIKRENLSDEDKLNNAKYAISVARKIGARIYALPDDLVEVKPKMVMTVFACLMGKGLNRIK +>XP_012933697.1_PREDICTED:_pyrroline-5-carboxylate_reductase_1,_mitochondrial_isoform_X1 +MSVGFIGAGQLAYALAKGFTAAGVLAAHKVMASSPDMELATVSALRKIGVNLTPHNKETVRHSDVLFLAVKPHIIPFILDEVGADLEDRHLVVSCAAGVTINSIEKKLRTYRPGPKVIRCMTNTPVVVREGVTVYATGTHAQVEDGRLLEQLLGSVGFCTEVEEDLIDAVTGLSGSGPAYAFTALDALADGGVKMGLPRRLAVRLGAQALLGAAKMLLDSEQHPSQLKDNVCSPGGATIHALHVLESGGFRSLLINAVEASCTRTRELQTMADQETVSPAAIKKTVLDKVKLDSSARASLSSSDRAKPLAHSLAPAGQD +>XP_012923360.1_PREDICTED:_gamma-aminobutyric_acid_receptor_subunit_alpha-3 +MIITQMCHVYTTSLGLLFLLSILPATTGQGESRRQEPGDFVKQDIGGLSPKHPNIPEDSTDNITIFTRILDRLLDGYDNRLRPGLGDAVTEVKTDIYVTSFGPVSDTDMEYTIDVFFRQTWHDERLKFDGPMKILPLNNLLASKIWTPDTFFHNGKKSVAHNMTTPNKLLRLVDNGTLLYTMRLTIHAECPMHLEDFPMDVHACPLKFGSYAYTTAEVVYSWTLGKNRSVEVAQDGSRLNQYDLLGHVVGTEIIRSSTGEYVIMTTHFHLKRKIGYFVIQTYLPCIMTVILSQVSFWLNRESVPARTVFGVTTVLTMTTLSISARNSLPKVAYATAMDWFIAVCYAFVFSALIEFATVNYFTKRSWAWEGKKTPEVPETKEKTPATPTQKASTTFNIVGTTYPINLATKETEFSTISKGATSSASSTPTIIASPKATFVQDSPTEIKTYNSVSKVDKVSRIIFPVLFAIFNLVYWATYVNRESAIKGMIRKQ +>XP_012930246.1_PREDICTED:_leucine-rich_repeat_transmembrane_protein_FLRT1 +MVVAHPTAAATTTPTTTVTATVVMTTATMDLRDWLFLCYGLIAFLTEVIDSTTCPSVCRCDNGFIYCNDRGLTSIPTDIPDDATTLYLQNNQINNAGIPQDLKTKVNVQVIYLYENDLDEFPINLPRSLRELHLQDNNVRTIARDSLARIPLLEKLHLDDNSVSTVSIEEDAFADSKQLKLLFLSRNHLSSIPPGLPHTLEELRLDDNRISTIPLHAFKGLHSLRRLVLDGNLLANQRIADDTFSRLQNLTELSLVRNSLAAPPLNLPSAHLQKLYLQDNVISHIPYNTLAKMRELERLDLSNNNLTTLPRGLFDDLGNLAQLLLRNNPWFCGCNLMWLRDWVKARAAVVNVRGLMCQGPEKVRGMAIKDITSEMDECFETGSQGGAANAAAKTTASNHAAATTPQGSLFTLKAKRPGLRLPDSNIDYPMATGDGAKTLVIQVKPLTADSIRITWKATLPASSFRLSWLRLGHSPAVGSITETLVQGDKTEYLLTALEPKSTYIICMVTMETGNTYVADETPVCAKAETADSYGPTTTLNQEQNAGPMVGLPLAGIISGAVALVFLFLVLGAICWYVHRAGELLTQERAYNRGSRKKDDYMESGTKKDNSILEIHGPGLQMLPINPYHAKEEYVVHTIFPSNGSSLCKGTHTIGYGTTRGYRDGGIPDIDYSYT +>XP_012925936.1_PREDICTED:_general_transcription_factor_II-I_repeat_domain-containing_protein_1_isoform_X1 +MALLGKRCDLPANGCGPDRWNSAFTRKDEIITSLLSALDSMCSALSKLNAEVACIAVHDDSAFVVGTAKGRMFLSARKELQSDFLRFCRGPLWKDSEAEHPKKVLRGEGGSRSAPRSSLERGSDVYLLRKMVEEVFDVLYSEALGTASVVPLPYERLQREPGLLAVQGLPEGLAFRRPAEYDPKALMAILEHSHRIRFKLKRPLDDGGRDSKALVELNGVSLLPKASRDCGLHGQAPKVPPQDLPPTAASSSMASFLYSPGLAGHAVIRELKQEAPACPLAPSDLGLGLPLPEPKVPGAQDLSDCCGQKPTGPTGPLIQNVHASKRILFSIVHDKSEKWDAFIKDTEDINTLRECVQILFNSRYAEALGLDHMVPVPYRKIACDPEAVQIVGIPDKIPFKRPCTYGVPKLKRILEERHSIHFVIKRMFDERIFTGNKFTKDSTKLEPASPPEDPSAEASRAGLLDLAATAWSDKGSVSEDCGAGTSGELGMLRPIKIEPEDLDIIQVTVPDPSPASEDMTDSLPDPLPSEDSGYGMEVAADKGPSEDPRPEERPVEDSHGDVIRPLRKQVELLFNTRYAAVHSPSPAEAIGISEPVKVPYSKFLMHPEELFVVGLPEGISLRRPNCFGIAKLRKILEASDSIQFVIKRPELLTEGVKEPVADSQERDSGDPLVDESLRRQGFPENYDARLSRIDIANTLREQVQDLFNKKYGEALGIKYPVQVPYKRIKSNPGSVIIEGLPPGIPFRKPCTFGSQNLERILAVADKIKFTVTRPFQGLIPKPDEDDANRLGEKVILREQVKELFNEKYGEALGLNRPVLVPYKLIRDSPDAVEVTGLPDDIPFRNPNTYDIHRLEKILKAREHMRIVIINQLQPCTEISTDAKVPARDSVPKRKRKRASEGNSVSSSSSSSSSSSSNPESVASTNQISLVQWPMYMVDYTGLNVQLPGALNYWTSAPNQDLTERLKEV +>XP_004846237.1_PREDICTED:_ATP-dependent_RNA_helicase_SUPV3L1,_mitochondrial +MSFPRCALLWAWLPAGRQAGHRRVVCSHALRAHCGPFPGALGRVSALAAFSSSESGGSKAPNTSLFVPLTVKPQGPRTDGDVGAELTRPLDKNEVKKILDKFYKRNEIQKLGADYGLDARLFHQAFISFRNYIMQSHSLDVDIHIILNDICFHAAHVDDLFPFFLRHAKQIFPVLECKDDLRKISDLRIPPNWYPEARAIQRKIIFHSGPTNSGKTYHAIQKYFSAKSGVYCGPLKLLAHEIFEKSNAAGVPCDLVTGEERVTVVPDGKQTAHVSCTVEMCSVTTPYEVAVIDEIQMIRDPSRGWAWTRALLGLCAEEIHLCGESAAIDMVTELMYTTGEEVEVRNYKRLTPISVLDHALESLDNLRPGDCIVCFSKNDIYSVSRQIEIRGLESAVIYGSLPPGTKLAQAKKFNDPSDPCKILLATDAIGMGLNLSIKRIIFYSLLKPTINEKGEKEIEPITTSQALQIAGRAGRFSSQFKEGEVTTMNHKDLGLLKDILSRPVDPVKAAGLHPTAEQIEMFAYHLPDTTLSNLIDIFVDFSQVDGHYFVCNMDDFKFSAELIQHIPLSLRVRYVFCTAPINKKQPFVCSSLLQFARQYSRNEPLTFAWLRRYIKWPLSPPKNIKDLVDLEAVHDVLDLYLWLSYRFMDMFPDAILIRDLQKELDGIIQDGVRNINRLIRISESQKLLNLEGLSAGSQALLSRTLKGQTRRMNITKAAGRKTAEPASPGSEKITLASRLVQQGLLTPDLLRQLEKEWLTQQTQQGKERTESGTQLKGPRRKKKEPNSD +>XP_004863045.1_PREDICTED:_ceramide_synthase_5_isoform_X1 +MAAAAAGALGLLWGWLWSESFWLPQNVSWDDLEAPSDGHGYGYPRARHILSVFPLAAGIFSVRLLFERFIAKPCALHVGIEDSGPYLAQDNTILEKVFVSVTKYPDQKRLEGLSKQLDWDVRKIQCWFRHRRNQDKPPTLTKFCESMWRFTFYLCIFCYGIRFLWLSPWFWDTRQCWYNYPLQPLSKELYYYYIMELAFYWSLMFSQFTDIKRKDFLIMFVHHLATIGLITFSYINNMVRIGTLVLCLHDVSDFLLEAAKLANYAKYQRLCDSLFVIFGAVFMVTRLGIYPFWVLNSTLFESWEIIGPYPSWWFFNGLLLILQLLHIIWSYLIARIAFKALLRGKVSKDDRSDVESSSEEEDETINTKNLSSNSSSNGASWVNGHMGGSCWAEK +>XP_004866915.1_PREDICTED:_L-amino-acid_oxidase_isoform_X2 +MARLALHLLALAPILFSLAPSLAWKEASSQDPFEKCMHDPDYELLLKVVTQGLNRTLQPQKVIVVGAGVAGLVAAKVLSDGGHKVTVLEADNRIGGRILTFRDPKTSWSGELGAMRMPSSHRILHMLCKSLGLNLTKFTQYDENTWTEVNGVKLRNYVVEKMPEKLGYKLRPKERGRSPEDIYQMALNKAQKDVKALGCRKALRKFERHTLLEFLRGEGNLSRPAVQLLGDVMSKDGFFYLSFEEALRAHSCLSDQLRYSRIVGGWDLLPRALLSSLSGPVLLNAPVVAVTQGTRDVRVHIATSSQSRSLKALTADVVLLTASGPALQRMTFSPPLSRERQEALRRLHYVPATKVFLSFRRPFWQDEGIEGGHSNTDRPSRAVFYPPPGEGALLLASYTWSDATNAFAGLGTEEVLRLALTDVAALHGPHVYRLWDGTGIVKRWAEDPHSQGGFVVQPPVLWQTDGDEDSEAFAQPYDWTTPHGRIYFAGEHTAYPHGWVETAVKSALRAALRINSPEGQACTEAPQQLGAEHQATYRVPGHPLLRLPHSTHRKTSH +>XP_004840362.1_PREDICTED:_T-box_transcription_factor_TBX20_isoform_X1 +MEFAASPKPQLSSRANAFSIAALMSSGGSKEKEAESTIKPLEQFVEKSSCAQPLAELTSLDAQGEFGGAGGSSPSSTSLCTEPLIPTAPIIPSEEMAKITCNLETKELWDKFHELGTEMIITKSGRRMFPTIRVSFSGVDPEAKYIVLMDIVPVDNKRYRYAYHRSSWLVAGKADPPLPARLYVHPDSPFTGEQLLKQMVSFEKVKLTNNELDQHGHIILNSMHKYQPRVHIIKKKDHTASLLNLKSEEFRTFIFPETVFTAVTAYQNQLITKLKIDSNPFAKGFRDSSRLTDIERESVESLIQKHSYARSPIRTYGGEEDVLGEESQTTSNRGSAFTTSDNLSLSSWVSSSSSFPGFQHPQPLTALGSSTASIATPIPHPIQGSLPPYSRLGMPLTPSAIATSMQGSGPTFPSFHMPRYHHYFQQGPYAAIQGLRHSSAVMTPFV +>XP_004859031.1_PREDICTED:_tubulin-folding_cofactor_B +MEVTGMKAPTVTVFISSSLNSFRSEKRYSRSLTIAEFKCKLELVVGSPASCMELELYGADDKFYGKLDQEDALLGSYPVDDGCRIHVIDHSGARLGEYEDVSKVERYQISQEAYDQRQDTVRSFMKRSKLGRYNEEERAQQEAEAAQRLMEEKALASSISVGSRCEVRAPGQSPRRGTVMYVGLTDFKPGYWIGVRYDEPLGKNDGSVNGKRYFECQAKYGAFVKPSLVTVGDFPEEDYGLDEM +>XP_004867171.1_PREDICTED:_hypoxia-inducible_factor_3-alpha_isoform_X3 +MALGLQRARSSTELRKEKSRDAARSRRSQETEVLYQLAHTLPFARGVSAHLDKASIMRLTISYLRMHRLCAAGEWNQVGAKGEPLDACYLKALEGFVMVLTTEGDMAYLSENVSKHLGLSQLELIGHSIFDFVHPCDQEELQDALTPRPSLSKKKPEAPTQRCFSLRMKSTLTSRGRTLNLKAATWKVLHCSGHMRAYKSSGQPALAGNPSSEPPLQCLVLICEAIPHPGNLEPPLGRGAFLTRHSLDMKFTYCDERIAEVAGYSPDDLIGCSAYEYIHALDSDAVSRSIHTLLSKGQAVTGQYRFLARSGGYLWTQTQATVVSGGRGPQSESIICVHFLISRVEETGVVLSLEQTERHSRRPLQRGTSSQKDGPNPGDRLDTPGPWILAFLHPPALSEATLAADPRRFCSPDLRRLLAPILDGAAVATTPSTPQAAWRPRSPLAADLPDELLVGMERIHRLGAAGKNPEAEDTDLNIASDADALDLEMLAPYISMDDDFQLSSSEQLPRAFHRPPGTVPRPRAQSFHGLSPPTPEPAPLPRWGSDPRLSCSSPPRGDPSASSYTVGARKRALAQSSEDEGVDLLGVRPPKRSPSLDPENFLLPPVSLMGKPERARGWLKVIRKINGPAEVRTLIF +>XP_004859425.1_PREDICTED:_NF-kappa-B_inhibitor-interacting_Ras-like_protein_2 +MGKSCKVVVCGQASVGKTSILEQLLYGNHVVGSEMIETQEDIYVGSIETDRGVREQVRFYDTRGLRDGTELPRHCFSCTDGYVLVYSTDSRESFQRVELLKKEIDKSKDKKEVTIVVLGNKCDLQEQRRVDPDVAQHWAKSEKVKLWEVSVADRRSLLEPFVYLASKMTQPQSKSAFPLSRKNKASGSLDG +>XP_004851401.1_PREDICTED:_NADH-ubiquinone_oxidoreductase_75_kDa_subunit,_mitochondrial +MLRIPVRRALAGLSKSSTGYVRTTATVASNLIEVFVDGQSVMVEPGTTVLQACEKVGMQIPRFCYHERLSVAGNCRMCLVEIEKAPKVVAACAMPVMKGWNILTNSEKSKKAREGVMEFLLANHPLDCPICDQGGECDLQDQSMMFGSDRSRFLEGKRAVEDKNIGPLVKTIMTRCIQCTRCIRFASEIAGVDDLGTTGRGNDMQVGTYIEKMFMSELSGNVIDICPVGALTSKPYAFTARPWETRKTESIDVMDAVGSNIVVSTRTGEVMRILPRMHEDINEEWISDKTRYVLFVFFIFFVGLRIEKAKAVLNLVGSKKCFYFSWLHNDLQVALIGSPVDLTYRYDHLGESPKVLQDIASGSHPFSQVLKAAKKPMVVLGSSALQRSDGAAILTAVSSIAQNIRVTSGVPSDWKVMNILHRVASQVAALDLGYKPGVEAVRKNPPRVLFLLGADGGCITRHDLPKDCFIIYQGHHGDVGALIADVILPGAAYTEKSGTYVNTEGRAQQTKVAVTPPGLAREDWKIIRALSEIAGITVPYDTLDQVRNRLEEVSPNLVRYDDVEGANYFQQASELSKLVNQQLLADPLVPPQLTIKDFYMTDSISRASQTMAKCVKAVTEGAQAVEEPSIC +>XP_012923055.1_PREDICTED:_arylsulfatase_B_isoform_X2 +MGLPRGARPLLPLLLPLLLAPRSSGAGPGRPPHLVFVLADDLGWNDVGFHGSRLRTPHLDALAAGGVQLDNYYTQPLCTPSRSQLLTGRYQIHTGLQHQIIWPCQPSCVPLDEKLLPQLLQEAGYATHMVGKWHLGMYQKECLPTRRGFDTYFGYLLGSEDYYTHEHCVFIKALNVTRCALDFRDGEEVATQYKNLYSTNIFTNRATSLIANHPPEKPLFLYLALQSVHEPLQVPEEYLKPYDFIQDKNRHLYAGMVSLMDEAVGNVTAALKSHGLWNNTVFIFSTDNGGQTLAGGNNWPLRGRKWTLWEGGVRGVGFVASPLLKQKGVKNRELIHISDWLPTLVKLAGGDTHGTKPLDGFDVWRTISEGSPSPRMELLHNIDPSFVDLSPCPGNSTTPAKDDSFPEYSTFNTSVHAAIRHGNWKLLTGFPVSPQSGRQKFLV +>XP_004870855.1_PREDICTED:_uncharacterized_protein_C11orf70_homolog_isoform_X1 +MAAGEPGVSGGYYFRFLPQKTFPSLSAPETTSRLRQWSMLGRIKAQAFGFDQTYRAYRKDDFVMAFFKDPNVIPNLHLLSDSSGQWMTLGTEVKKVEATNVPCTQLSMSFFNRLYDENIVRDTGHIIKCLDSFCDPFLISDELRKRKGERKLGNGDGQVLHVAHPENNKLWTTSPHLSLTVLLVEDSEKYEVFSKPDREEFLFCLFKHLCLGGSLCQYEDVLNPYLETAKLIYKDLVSVRKHPQTKKIQITSSVFKVAAYDSTGMCYPSTKNHEQTFSYFIVDPIRRHVNVLYHCFGVGEMS +>XP_004847639.1_PREDICTED:_histone_H2B_type_1-A +MPELTSKVATISKKGFKKAVIKTQKREGKKRKKCRKESYCIYIYKVLKQVHPDTGISSKAMSIMNSFVSDTFERISSEASRLVHYNKRSTISSREIQTAVRLLLPGELAKHAVSEGTKAVTKYNSSK +>XP_004863992.1_PREDICTED:_matrix_metalloproteinase-23 +MRHGLCVPPGPSQAVAVRSRPLRAVLGALCLLPALAVLSWQGAPGGHAAQSDIQGWDSVVSNGPVPSPLSPLAPRKRRYTLTPGRLRWDHFNLTYRILSFPRNLLSPRETRRGLAAAFRMWSDVSPFSFREVDPEQPSDLRIGFYPDNHTDCLVSALHHCFDGPTGELAHAFFPPHGGIHFDDSEYWVLGPTRYSWKKGVWLTDLVHVAAHEIGHALGLMHSQHGQALMHLNATLRGWKALSQDELWGLHRLYGCLDRLFVCASWARRGFCDTRRRLMKRLCPSSCDFCYEFPFPTVAATPSPPRTKTRLVSEGRNVTLRCGQKILHKKGKVYWYKDQEPLEFSYPGYLALGKARLSIIANAVNEGTYTCVVRRHQRVLTTYSWRVHVRS +>XP_004870648.2_PREDICTED:_arf-GAP_with_dual_PH_domain-containing_protein_2_isoform_X1 +MSDRERNKKRLLELLHAADTGNARCADCGAPDPDWASYKLGIFICLHCSGVHRNFPEISKVKSVRLDFWDDSIVEFMTHNGNLHVKAKFEASVPAFYYIPQASDCSVLKEQWIRAKYERQEFMADGKPLSSPGNREGILWKRGRDNGQYLRRRFVLLAREGLLKYYTKEQGKGPKAVISIKDLNATFQTEKIGHPHGLQITYGRESHTRNLFLYHESGKEIVDWFNALRAARLQYLKMAFPDLPEAELVPLITRNYLKQGFMEKTGPKQREPFKKRWFALDPQERRLLYYKNPLDAFEQGQVFLGSKEQGYEVLEELPKGVRGSRWKAGLTIVTPHRRFVLTCPSEKEQREWLESFRDVLSRPLTPLHLLGAPTESGCSNR +>XP_012930984.1_PREDICTED:_protein_FAM63A_isoform_X1 +MEHAGPEQPGPDQVGRAEAVTWENHEVPLGSQEQPQNGNARDADGEREPGDPTPLPARGGENLERPVPEAQACPPGPACGKPPEVEMIGACSGPQELPQSPRARKPEPDFYCVKWIPWKGARTPVITQSANGPCPLLAIMNILFLQWKVKLPPQKEVITAEELMAHLGDCLLSIKPQEKSEGLQLNFQQNVDDAMMVLPKLATGLDVNVRFTGVSDFEYTPECSIFDLLGIPLYHGWLVDPQSPEAVSAVGKLSYNQLVEKIITCKHASDPNLVTEGLIAEQFLENTAAQLTYHGLCELTAAAKEGELSVFFRNNHFSTMTKHKSHLYLLVTDQGFLQEEQVVWESLHNVDGDSCFCDSDFHLSHSLGKAPGGEVGKSSPEEQLQVDQDYLIALSLQQQQQPQGALGLTDLELAQQLQQEEYQQQQAEQEQPGQARAPLPQGRGTTSGRPAREWHQRPKHQSDCILL +>XP_004871241.1_PREDICTED:_semaphorin-4A_isoform_X1 +MALPALGLDPWSLLGLFFFQLLLLLLPPLTAGAGGQGPMPRVRYSAGDPRRALSLFHQKGLQDFDTLLLSGGGNTLYVGVREAVLALDVQHPGAPQLRSMIPWPASDRKKHECALKKKSSETQCFNFIRVLVSFNATHLYACGTFAFSPACTFIEFRDSQLSPISEKTVMEGKGQSPFDPAHKHTAILVDGMLYSGTMNNFLGSEPILMRTLGPRPVLKTDTFLRWLQSDASFVAAVPSTQVVYFFFEETASEFDFFEKLRTSRVAQVCKNDMGGEKLLQKKWTTFLKAQLLCTQPGQLPFNVIRHAVLLPAESAAEARVYAVFTSQWQVGGTRSSAVCSFSLSDIENVFKGQFKELNKETSRWMTYVNPETSPRPGSCAVGPSSDKALTFMKDHFLMDEQVVGTPLLVKSDVEYTRLTVETARGLDGHSYVVMYLGTSTGFLHKAVVSQASRAYLVEEIQLFPEPEPIRNLQLAPSQGAVFAGFSGGVWRVPRANCSVYESCVDCVLARDPHCAWDPESRVCSLLWTLDLMSWKQDMERGNPEWACAKGPLGRSHRPQSRPQIIKEVLVVPNSILELPCPHLSVLASYRWSRGTRTVPEASSAVYNGSLLLLPQDGVGGLYQCIATENGFSYPVVSYWVHSQDQPLALDPELAGIPRERVQVPLTRVGGGATAAAQRSYWLHFLVVTVLLALVLSGALIVLLASPLGALRARGKVQGCGTLPPGEKAPLSREPRVQPPKESRTSATDVDADNNCLGTEVA +>XP_004862136.1_PREDICTED:_solute_carrier_family_41_member_1_isoform_X2 +MSSKPEPKDAHQLNGTGPAPSPCASDGPGREPLAGTSEFLGPDGAGVEVVVIESRANAKGVREEDALLENGSQSNESDDVSTDRGPAPPSPLKETSFSIGLQVLFPFLLAGFGTVAAGMVLDIVQHWEVFQKVTEVFILVPALLGLKGNLEMTLASRLSTAANIGQMDTPKELWRMITGNMALIQVQATVVGFLASIAAVIFGWIPDGHFSIPHALLLCASSVATAFIASLVLGMIMIGVIIGSRKIGINPDNVATPIAASLGDLITLALLSGISWGLYLELNHWRYIYPLVCAIFLALLPVWVVLARRSPATREVLYSGWEPVIIAMAISSVGGLILDKTVSDPNFAGMAVFTPVINGVGGNLVAVQASRISTFLHMNGMPGENSEQAPRRCPSPCTTFFSPDVNSRSARVLFLLVVPGHLVFLYTISCMQGGHTTLTLIFIIFYMTAALLQQNGRVKRKPAHSDNCSTAASNSLLIPLFPANKAL +>XP_004859278.1_PREDICTED:_RUN_domain-containing_protein_3A_isoform_X5 +MEAGLVPATMALGLSSKKASSRNVAVERRNLITVCRFSVKTLLEKYTAEPIDDSSEEFVNFAAILEQILSHRFKGPASWFSSDGQRGFWDYIRLACSKVPNNCVSSIESMENISTARAKGRAWIRVALMEKRMSEYITTAVRDSRTTRRFYDSGAIMLREEATVLIGMLIGLSAIDFSFCLKGEVLDGKTPVVIDYTPYMKFTQSYDYLTDEEERHSAESSTSEDNSPEHPYLPLVTDEDSWYSKWHKMEQKFRIVYAQKGYLEELVRLRESQLKDLEAENRRLQQQLEEAAAQNQREKRELEGVILELQEQLTGLIPGDHGLLAQASRELTTPLVNQWSLLGTLSGTEGASNPKLYRRHSFLSTEPLSAEASLSSDSQRLEEGKRDDQPWGPIGKDPTPSMLGLCGSLASIPSCKSLASFKSNECLPSQGALGRPRRLSFLLQEEQWAGTTPGTQGAAPPPAGPKAWPDPSGCSPAAASRLTPHTPEPAFPSPTRALGSSK +>XP_004848635.1_PREDICTED:_LOW_QUALITY_PROTEIN:_maestro_heat-like_repeat-containing_protein_family_member_2B +MFGDINVTLGILNKEDVISKEDIYSHLTSVIQNTDILGDAIVQRLIHYTSKDMKDEKVSLVLRFLAGEVLVSLAAHDFNSVMSEVQSNFRILELPNEFIVLALAELASSYVSQSIPFMMMTLLTMQTMLRLAEDERMKQTFCLALEKFSKAIYKYVNHWRDFPYPRLNASRLSDKIFMLFQYIMEKWAPAASHINTLALVKAHGPTVSLLLHWEDFCEFALSQVPWLLNQYGNQEADFHITQSVKQILTAAVLYDIDLPRALKRSIFINLLHQISRVPGPPSENEIEVSSCFLILAHLNPAALVEFFDEQIRSNNEAIRMKILTLLRSAINAEEPKLKNHIISIERXKVIMNDLSPKVRTSTLLFIQTMCEKSYIEAREGWPLIDYIFSQFATSSRTLEKPVKTNSPEDETGEKSVQETSLQVLKTLDPLVIGMPQVLRPRILTFVVPKEXTGTLDYLFNIIRILIMAEERKKHSVTESTALVRSPGAVKLPSPQQLLARLLVISMLASLGKLCGAGATGLLKIVPEMIHPKLIDLWETHKPELLHSMEGKNGSMVLWETMLLQLLKESLWKIRDVAWTFQLSRDFNQQMNSYSNTSVEKKFLWKALGTTLASCHDKDFVSSQIKEFLIAPSQLGDQRQGVASILGCCVEDHFDTVLKVLKTFQDEEKIFMNRCKSLFSGKKNLTKTDVIVIYGAVALHAPKRELLTRLHQDIMAQVLYLYGQCSQVLGMSVMNKDMDLQMSFTRSITEIGIAVQDAEDQNFQFSYKQMLISQMLDFIREEPLDSLASPVRWKALIAIRYLSKLKPQLPLHDHLKILEENIRRLLPLPPLEKLASQGETDNDQEHINFLYERSMDALGKLLRTMMWDDVDAENCQEMFNLLRMWLVSPKEWERERAFQITAKILTNDTEAPENFKIGSLLGLLAPHSCDTLPTIHQAATSSTIGLFCMKGIHLEVERLQNLQEGLECDDVQVQIKISSKIAKIVCKFIPTDEIQMFLEETLDGVESLNPMHMKACDIWMITALKEHGAVLEHQLLEILSTIHYHMPVLRQKEESFQFMLEAVSQIASFHMNAVVVSLLQKPLPFDRDTKTLWKALAENPASSGELIRALIDKLEARLEDDIAGIDAISVGCAMYEVVSTGVPVTGLYAELFTLLLKLVSCTLGQKMPTSALSHRRRVMQQGERQQVPDPCRLSTATLKCLQAQPMREGLAKDSDEGENLWTLLSNPDTHHIGVCALSRSMAVWQHRVILNIMEHLLPSLTSSSENYRITGTAFFSELMKEPIHWKHGNLRDMLILMDQSAWDSNATFRQTAIRGLGNTASGAPYKVKKHKQIILEFVIRGLYHLARTEVVCESLKALRKILELLTDRDVSFYFKEIVLQTRTFFEDEQDNVRLTAIILFENLASLTGRQWKTFFAEEIKKSMISFLLHLWDPNPKIGAACRDVLIICFPFLGLQELYEILDHLLDQDLPRARDFYRQFCMKLVSKNQEILWILHTHSFTFFTSSWEMIRSAAVKLTDAIVLNLTSQYVELLDREQLTTRLQALCLDPCIGVQRAAKAALQTLLRRCKETSIPL +>XP_004864467.1_PREDICTED:_2-hydroxyacyl-CoA_lyase_1_isoform_X3 +MPESHFVAPSDRSAEQVSGAKVVAQALKAQDVRYVFGVVGIPVTEIALAAQELGIRYIGMRNEQAASYAASAVGYLTGRPGVCLVVSGPGLIHALAGMANANMNCWPLIVIGGSSERNQETMGAFQEFPQAVRISIYGRPGACYVDIPADFVTVQVNVNSIKYKECCMPPPVTMAEASAVCLAASVIRSAKQPLLVIGKGAAYAHAEENIRKLVEQCKLPFLPTPMGKGVVPDNHANCVSAARSRALQFADVIVLFGARLNWILHFGLPPRYQPDVKFIQIDICAEELGNNVKPAVTLLGDINAVAKQLLEQFDKIPWQYPPESKWWKRLREKMKSNEAASKELASKISLPMNYYTVFYHVQEQLPKDCFLVSEGANTMDIGRTMLQNYLPRHRLDAGTFGTMGVGLGFAIAAALVAKDRSPGQRVICVEGDSAFGFSGMEMETICRYNLPIIVLVVNNNGVYQGFDADTWKEIVKFQDPVTVAPPMCLLPNSHYEQVMTAFGGKGYFVQTPEELQKSLKQTLEDTTKPSLINIMIEPQSTRKAQDFHWLTRSNM +>XP_012923573.1_PREDICTED:_NIF3-like_protein_1 +MLASPGRLVPAAFQLACSRAWSSSSGMDLKAVLSSLNDLAPLSFAESWDNVGLLVEPSPPHTVHTLFLTNDLTEAVLEEALREKADLVLSYHPPIFRPLTRVTWGTWKERLVVRALEARVAVYSPHTALDAAPQGVNTWLARGLGICTSKPIHPSRAPSHPTEGTHRVEFSVRHSQDLDTVLSAMKGISHASVTCFSSRTDSGEEQTRLSVTCTQEALTRVGVWLSQNSQLHEKTEVLVLEKPLLLQTGMGRLCTLEESVSLVTVIERVKRHLRLSHVRLALGAGRSLDSQVQDVALCAGSGSSVLQGVRADLYLTGEMSHHDVLDATSQGISVILCEHSNTERGFLSDLRDLLAMHLDSRVRLVLSECDRDPLSMM +>XP_004875617.1_PREDICTED:_E3_ubiquitin-protein_ligase_UBR2-like +MLYLIIMLVGERFSPGVGQVNATDEIKLEIIHQLSIKPMARSELVKSLPEDENKETGMENVTETVAHFKKPGLTG +>XP_004858495.1_PREDICTED:_lisH_domain_and_HEAT_repeat-containing_protein_KIAA1468_homolog_isoform_X1 +MAAMAPGGGGSGSGGVNPFLSDSEEDDDEVAATEERRAGLRLGASSGLDPGSAGSLSPQDPVALGSCARPGLSGEASAAAMALGGTGETPARLSVDAIAAQLLRDQYLLTALELHTELLESGRELPRLRDYFSNPGNFERQSGTPPGMGAPGILGAAGFGGAGGREPSTTSGGGQLNRAGSISTLDSLDFARYSDDGNRETDEKVAVLEFELRKAKETIQALRANLTKAAEHEVPLQERKNYKSSPEIQEPIKPLEKRALNFLVNEFLLKNNYKLTSITFSDENDDQDFELWDDVGLNIPKPPDLLQLYRDFGNHQVTGKDLVDVASGVEEDELEALTPILGNLPPTLETPQPLENSLLVQKLEDKISLLNSEKWSLMEQIRGLESEMDFLKNEHFAIPAVCDSVQHSLDQSPHKDSEDSGQSPVVNNSDKKKNEDIHLSISQEDDSTIPKKKSDSFPRREKEGIPSSSPSSKNTIHFDKPNRKLSPAFHQALLSFCRMSADSRLGSEVSRIADSEKSVMLMLGRCLPHIVPNVLLAKREELIPLILCTACLHPEPKERDQLLHILFNLIKRPDDEQRQMILTGCVAFARHVGPTRVEAELLPQCWEQINHKYPERRLLVAESCGALAPYLPKEIRSSLVLSMLQQMLMEDKADLVREAVIKSLGIIMGYIDDPDKYQQGFELLQSALGDPSERVVSATHQVFLPAYAAWTTELGNLQSHLIPTLLNKIEKLLREGEHGLDEHKLHMYLSALQSLIPSLFALVLQNAPFSSKAKLHGEVPQIEVTRFPRPMSPLQDVSTIIGSREQLAVLLQLYDYQLEHEGTTGWESLLWVVNQLLPQLIEIVGRINVTSTACVHEFSRFFWRLCRTFGKIFTNTKVKPQFQEILRLSEENIDSTAGNGVLTKATVPIYATGVLTCYIQEEDRKLLVGFLEDVMTLLSLSHAPLDSLKASFVELGANPAYHELLLTVLWYGVVHTSALVRCTAARMFELLVKGVNETLVAQRVVPALITLSSDPEISVRIATIPAFGTIMETVIQRELLERVKMQLASFLEDPQYQDQHSLHTEIIKTFGRVGPNAEPRFRDEFVIPHLHKLALVNNLQIVDSKRLDIATHLFEAYSALSCCFISEDLMVNHFLPGLRCLRTDMEHLSPGHEVILSSMIKECEQKVENKTVQEPQGSMSIAASLVSEDTKTKFLNKMGQLTTSGAMLANVFQRKK +>XP_012931824.1_PREDICTED:_sarcoplasmic/endoplasmic_reticulum_calcium_ATPase_1_isoform_X2 +MGKVYRADRKSVQRIKARDMVPGDIVEVAVGDKVPADIRILSIKSTTLRVDQSILTGESVSVIKHTDPIPDPRAVNQDKKNMLFSGTNIAAGKAVGIVATTGVNTEIGKIRDQMAATEQDKTPLQQKLDEFGEQLSKVISLICVAVWLINIGHFNDPVHGGSWFRGAIYYFKIAVALAVAAIPEGLPAVITTCLALGTRRMAKKNAIVRSLPSVETLGCTSVICSDKTGTLTTNQMSVCKMFIVDKVDGDICLLNEFSITGSTYAPEGEVMKNDKPVRAGQYDGLVELATICALCNDSSLDFNEAKGVYEKVGEATETALTTLVEKMNVFNTDVRSLSKVERANACNSVIRQLMRKEFTLEFSRDRKSMSVYCSPAKSSRASVGNKMFVKGAPEGVIDRCNYVRVGTTRVPLTGPVKEKILSVIKEWGTGRDTLRCLALATRDSPPKREEMVLDDSSKFMEYEMDLTFIGVVGMLDPPRKEVTGSIQLCRDAGIRVIMITGDNKGTAIAICRRIGIFSESEEVTDRAYTGREFDDLPLAEQRDACRRACCFARVEPSHKSKIVEYLQSYDEITAMTGDGVNDAPALKKAEIGIAMGSGTAVAKTASEMVLADDNFSTIVAAVEEGRAIYNNMKQFIRYLISSNVGEVVCIFLTAALGLPEALIPVQLLWVNLVTDGLPATALGFNPPDLDIMDRPPRSPKEPLISGWLFFRYMAIGGYVGAATVGAAAWWFLYADDGPHVSYYQLTHFMQCTEHNAEFGGLDCEVFEAPEPMTMALSVLVTIEMCNALNSLSENQSLVRMPPWVNVWLLGSICLSMSLHFLILYVDPLPMIFKLQPLTVTQWLMVLKISLPVIGLDEILKFVARNYLEDPEDERRK +>XP_012926870.1_PREDICTED:_hemK_methyltransferase_family_member_2_isoform_X3 +MAARSFPTPLHGHVGRGEFSDVYEPAEDTFLLLDALEAAAPELAGVEICLEVGSGSGVVSVFLASMIGPQALYMCTDVNPEAAACTLETAHCNRVHIQPVITDLVKGLLPRLKEKVDLLVFNPPYVVTPPEEKKF +>XP_012924189.1_PREDICTED:_serine/threonine-protein_kinase_WNK1_isoform_X5 +MSGGAAEKQSSTPSSLFLSPPAPVSKNGSSSDSSVGEKLGSAATDAGPGRTEEYRRRRHTMDKDSRGAAAATTTTTTEHRFFRRSVICDSNATALELPGLPLSVPQPGAPAAVPQSAPAEPHREETLTAAVASQVAQQAPPTAAPGDQAASGPAAPTVPSSTNKDRPVPQPSLVGSKEEPPPAKIGSGSGGGGSAKEPQEERGQQQDDIEELETKAVGMSNDGRFLKFDIEIGRGSFKTVYKGLDTETTVEVAWCELQDRKLTKSERQRFKEEAEMLKGLQHPNIVRFYDSWESTVKGKKCIVLVTELMTSGTLKTYLKRFKVMKIKVLRSWCRQILKGLQFLHTRTPPIIHRDLKCDNIFITGPTGSVKIGDLGLATLKRASFAKSVIGTPEFMAPEMYEEKYDESVDVYAFGMCMLEMATSEYPYSECQNAAQIYRRVTSGVKPASFDKVAIPEVKEIIEGCIRQNKDERYSIKDLLNHAFFQEETGVRVELAEEDDGEKIAIKLWLRIEDIKKLKGKYKDNEAIEFSFDLERDVPEDVAQEMVESGYVCEGDHKTMAKAIKDRVSLIKRKREQRQLVREEQEKRKQEESNLRQQVEQQSSASQTGIKQLPSASTGIPTAPATSASVSTQVEPEEPEADQHQQLQFQQPSISVLSDGTVDSGQGSSVFTDSRVSSQQTVSYGSQHEQAHSAGTVPGHTAATVQAQSQPHGVYPPSSMAQGQSQGQPSSSSLAGVPSSQPIQHPQQQQGIQQTALPQQTVQYSLTQTATSSEATTAQPMIQPQTSQVLPQVSTGKQLPVSQPAPTVQGEPHISIATQPSVVPVHSGAHFLPVGQPLPTSLLPQYPVSQIPISTPHVSTAQTGFSSLPITMAAGINQPLLTLASSATSAAIPGASTVVPSQLPTLLHPVTQLPSQVHPQLLQSAVQSMGIPANLGQAAEVTLPSGDVLYQSTQGVSQVAPPEPVPVTQPQPIQPVNLVSSVDSAHSDVASGMSDGNENAPSSSGRHEGRTTKRHYRKSVRSRSRHEKTSRPKLRILNVSNKGDRVVECQLETHNRKMVTFKFDLDGDNPEEIATIMVNNDFILAIERESFVDQVREIIEKADEMLSEDVSVEPEGDQGLEGLQGKDDYGFSGSQKLEGEFKKPIPASSMPQQIGVPASSLTQVVHSAGRRFIVSPVPESRLRESKVFTSEISDTVATPTSQGPGMNLSHSASSLSLQQAFSELKRAQMTEGPSTAPPDFSQMGPTFPPFLASTAGGPPTTAAPTPSISVPITSSPLNDVSTSVVQPEVIAPTEKGIAGVATSTRVVTSSGLSEPPVSESPILSSVVSSITVPAVVSVPTTSHPVQASTSGSTVPSIGTFCPITVPTTSASALGSAAASGAKPPNMFSQQAVGSTPETATVTSVSATTLLPSIVSQPSLLSSTSATTIAETVVSAQLLDKTPNSSATGLALSFSAPSSSSPGIGVATSVSQPGGLHPLAIPSSVASIPVLAQATGPISTPLLPQVPSIPPLIQPVSSVPAVQQTLIHSQPQPALLLSQPHMHCPEIDTDTQPKAPGIDDIKTLEEKLRSLFSEHSSSGAQHASVSLETSLVVETTVTPGIPTTAVAPSKLMTSTTSTCLPPTNLPLGTTGLSGMPVVTPGQVSTPGSYISAPVTTASGMKPGTAPSKASLTKAPVLSVGTELPAGTLPSEHLPPFPGPSLTQSQQPLEDLDAQLKRTLSPETLTVTSASGPVSVVAPTAATEAGAQPQKDVSQGTEGLVPVTSPGAGVLKMGRFQVSIAKDDAQKESKDKSEDAKSVHFESSTSESSVLSSSSPESTLVKPEPNGITIPGISSDVPDSTHKTPASEAKLEARQPTKVGRFQVTTTANKVGRFSVSRTEEKITEAKKEGSETSPFRDLEQAVLPAVIPKKEKPELSEPSHLNGPSSDLEAAFLGRDVDDGSGSPHSPHQLCSKSLPPQTLSQSLSNSFNSSYMSSDNESDIEDEDLKLELRRLREKHLKEIQDLQSRQKHEIESLYTKLGKVPPAVIIPPAAPLSGRRRRPTKSKGSKSSRSSSLGNKSPQLSGNLSGQSTASVLHPQQTLHPPGNLPDTGQNQLLQPLKPSPSSDNLYSAFTSDGAISVPSLLGPGQGTSSTNTVGGTVNIQAAQAQPPAITSSRKGTFTDDLHKLVDNWARDAMNLSGRRGSKGHMNYELFCSQGPGMARKFSAPGQLCISMNSNLGGSAPISAASATSLGHFTKSMCPPQQYGFPPTTFGPQWSGTGGPAPQPLGQFQPVGTASLQNFNISNLQKSISNPPGSNLRTT +>XP_012931925.1_PREDICTED:_interferon_regulatory_factor_5_isoform_X1 +MNQQPPGAPSQPRRVRLKPWLVAQVNSCQYPGLQWVNGERKLFYIPWRHATRHGPSQDGDNTIFKAWAKETGKYTEGVDEADPAKWKANLRCALNKSRDFCLIYDGPRDMPPQPYKIYEVCSNGPAPTESQPTEDYNVVPEEEKEEEEEEELQKMLPELRLTEAVQPGPSMAPYSLPKEDVKWPPVLPPPVGPALDPNLLVPAPGNPASFGQHLPEVLPSSEPLAPTLPPASEQLLPDLLISPHMLPLTDLEIKFQYRGRPPQALTISNPQGCRIFYSQLQATQEQVELFGPVSLEQVRFPSPEDIPSDKQRFYTNQLLDVLDRGLILQLQGQDLYAIRLCQCKVFWSGPCASTQGSSPNPIQREVKTKLFSLEQFLNDLILFQKGRTDTPPPIEIFFCFGEEWPDRKPREKKLITVQVVPVAARLLLEMFSGEFSWSADSIRLQISNPDLKDRMVEQFKELHHIWQAQQQLQPMAHGPPVAGLSAGQGPWPMHPVGMQ +>XP_004846985.1_PREDICTED:_helicase_SKI2W_isoform_X1 +MIETERLVLPPPDPLNLPLRAVELGCTGRWELLNVPGPPESTLPHGLPPCAPDLQQEAEQLFLSSPAWLPLHDVEHAARKWQRETDPWSLLAAVGAPVPSDLQAQRHPTTGQVLGYKEVLLENTNLSATTSLSLRRPPGPVSQSLWGNPTQYPFWPGGMDEPSLMDLSSREEHEEELDFEKDLLTVPPGFKKGVDFAPQDRPAPAPGLLSLSCLLEPLDLGGGDVEENEAVGQTEGPRGDAASASPCRAPLARASSLEDLVLREAATAPPEPPQPPLQEQWAVPVDVTSPVGDFYRLIPHPAFQWAFEPDVFQKQAILHLEKHDSVFVAAHTSAGKTVVAEYAIALAQKHMTRTIYTSPIKALSNQKFRDFRNTFGDVGLLTGDVQLHPEASCLIMTTEILRSMLYSGSDVIRDLEWVIFDEVHYINDAERGVVWEEVFIMLPDHVSVILLSATVPNALEFADWIGRLKRRQIYVISTLTRPVPLEHHLFTGNSPKTQGELFLLLDSRGAFHTKGYYAAVEAKKERMSKHAQTFGAKQPGRQAGPAQDRGVYLSLLASLRARAQLPVVVFTFSRGRCDEQASGLTSLDLTTSSEKSEIHLFLQRCLARLRGSDRQLPQVLHMSELLHRGLGVHHSGILPILKEIVEMLFSRGLVKVLFATETFAMGVNMPARTVVFDSMRKHDGSAFRDLLPGEYVQMAGRAGRRGLDPTGTVVLLCKARVPEMADLHRMMMGKPSQLQSQFRLTYTMILNLLRVDALRVEDMMKRSFSEFPFRKDSKAHEQTLAELTKKLGSLEEPDVTGQLADLPDYYGWGEELVETRSRIQQRILESVNGLKSLSVGRVVVVKSQEHHNALGVILQVSSSSASRVFTTLVLCDKPESQGLQDRGLATPTADVPHPDDLVGFKLFLPEGPCDHTVAKLQPADVAAITTKVLRVHGEKILEDFSKRQQPKFRKDPPLAAVATAVQELVRLAQACPAGPPTLDPVSDLQLKDVSVVEGGLRARKLEELIRGAQCVHSPRFSAQYVKLRERMRIQKEMARLRFLLSDQSLLLLPEYHQRVEVLRTLGYVDEAGTVKLAGRVACAMSSHELLLTELMFDNALSALRPEEIAALLSGLVCQTPGDPGDHLPSTLKQGVERVRAVAKRIGEVQVACGLNQTVEEFVGELNFGLVEVVYEWARGMPFSELAGLSGTPEGLVVRCIQRLAEMCRSLRGAARLVGEPVLGAKMETAATLLRRDIVFAASLYTQ +>XP_004842267.1_PREDICTED:_protein_BTG3 +MKNEIAAVVFFFTRLVRKHDKLKKEAVERFAEKLTLILQEKYKNHWYPEKPSKGQAYRCIRVNKFQRVDPDVLKACENSCILYSDLGLPKELTLWVDPCEVCCRYGEKNNAFIVASFQNEDENKDDISKKVTRALDKVTSDYHSGSSSSDEETSKEVEMKPSPLTATPSPVYQISELIFPPLPMWQPLPRKKPGMYRGNGHQSHYPPPVPFGYPNQGRKNKPYRSIPVTWVPPPGMHCDRNHWINPHMLAPH +>XP_004843204.1_PREDICTED:_kinesin-like_protein_KIFC3_isoform_X3 +MVPSPRTRNLGATPSLPGPRRVGRAGEPPEPKMARPAPAPASPAARPFSHTGSGRLRTGRGKDTVVGSDEDSSARIAARPALGQCRTLSGDWAGPGSPRRLYLTVRQALQDKGCKSKSQGTKEDNLPKRQALVPRRDREALKAGAATNVEKTGGRLFGKGRCSSLPGSPGAAPEVHRMVEAMSQLQKEKAQLQEELAVLRERLALHDSDQQTTTTQLQNQVENLKEKLVSQAQEVTRLRSELGGTELEKQRRDPLMVENERLRQELGRYEAELQELCAQPAATPCLGCKHSQESTQLRHKVSQLQLEVAENKGMLSELNLEVQQKTDRLAEVELRLKDCLAEKAQEEERLSRRLRDSHETIASLQAQSPPVKYVTKTVEVESSKTKQALSESQAQNQHLQEQVAMQRQVLKEMEQQLHSSNQLTTQLRAQISMYETELERAHGQMLEEMQSMEEDKNRAIEEAFARAQVEMKAVHENLAGVRTNLLMLQPALRTLTNDYNGLKRQVRNFPMLLDEALQSAKAEIDQIIEEVNSNNHDLLRKYRRELQLRKKCHNELVRLKGNIRVIARVRPITKEDGEGPDATNVVSFDPDDDAIIHLLHKGKPVSFELDKVFSPQASQQDVFQEVQALITSCIDGFNVCIFAYGQTGAGKTYTMEGTPENPGINQRALQLLFSEVREKASDWEYTITVSAAEIYNEILRDLLGTEPQEKLEIRLCPDGSGQLYVPGLTRFRVQSVADINKVFEFGYANRTTEFTNLNEHSSRSHALLIVTVQGRDCSTGIRTMGKLNLVDLAGSERVGKSGAEGSRLREAQHINKSLSALGDVIAALRSRQGHVPFRNSKLTYLLQDSLSGDSKTLMVVQVSPVEKNTSETLYSLRFAERVRSVELGPGSRRTELGSWSSQEHLELEPTCQTPQPTARAHSAPGSGTSSRPGSIRRKLQPSA +>XP_012929325.1_PREDICTED:_DNL-type_zinc_finger_protein +MLRKALGRIPVRLGGVRPWEPGLRRLWVRPAHPEAAGRRRAWAWGRGWRHLSCGPESAAGLGRLEATHYQLVYTCKVCGTRSSKRISKLAYHQGVVIVTCPGCQNHHIIADNLGWFSDLDGKRNIEEILAARGEEVHRVAIEGALELIVEMAGAPKSPVGLKEGDSEDPTHAGEMERS +>XP_004840254.1_PREDICTED:_histone_deacetylase_complex_subunit_SAP25 +MLPWPAGTGKEAAPELAGSDQGEACSSREEALRGPGKPPQDSLQPTALRPAGPRRRQLLPRYPPGLAPEGSPRIPVPLSPQVPSSGMTLFSPWDPNFGAKARPQPVWTPSCGPGASFSGRTLCHPSFWPMYEAWGRGRRHQAPSLGCQNGQQAPRDAGFPVMCSEDVFFLDPLLPPGQHVPLYLSEAPQQALGSMKLQLPPPIMSPSVYPSQPRGCCMAQLSGPELIAITSLLQMSQGEPRPGSSGAPPSPAGPLEPISDHQSSSGSTDPSLPRPSDTHCP +>XP_004852319.1_PREDICTED:_uncharacterized_protein_C11orf86_homolog +MRTGLRSCSLQGRPSYGKLREGQLWRALSLRRGRKSRSQGLDGGPEGLEASAQEKLPGSLGDTEQLIQAQRPGSRQWLKQYQQQVRRRWESFVASFPQVTLSQSASL +>XP_004849019.1_PREDICTED:_calcium_channel_flower_homolog_isoform_X1 +MSGSGGPGAPAGPAPPAQEEGMTWWWRWLCRLSGVLGAVSCAVSGLFSCITIHPLNIAAGVWMIMNAFILLLCEVPFCCQFVEFANAVAERVDQLRSWQKAVFYCGPVKTLTSFRIKFRGQVSDQFKDLLKPAVNLMAVVPIIMSLTLTTLLGNAVAFATGVLYGLSALGKKGDAISYARIQQQKQQVDEEKLVETVEGEL +>XP_012930018.1_PREDICTED:_brain-derived_neurotrophic_factor_isoform_X2 +MTILFLTMVISYFGCMKAAPMKEASVRGPGSLAYPGVRTHGALDSVTGPKVGARGLAASSSSSSLADTFEHVIEELLEEDQKVRPHEENAKDADLYTSRVMLSSQVPLEPPLLFLLEEYKNYLDAANMSMRVRRHSDPARRGELSVCDSISEWVTAADKKTAVDMSGGTVTVLEKVPVSKGQLKQYFYETKCNPMGYTKEGCRGIDKRHWNSQCRTTQSYVRALTMDSKKRIGWRFIRIDTSCVCTLTIKRGR +>XP_012929288.1_PREDICTED:_ectonucleoside_triphosphate_diphosphohydrolase_8_isoform_X3 +MGLSCKERIFMVLLGVATASGLTVLVLLLVEATSVLLPAETKFGIVLDAGSSHTSLFVYQWPSDKEKDTGVVSQALACQVEGPGISSYALNPVRAGESLKDCLEEALALVPRGQHQETPTFLGATAGMRLLRQKNSSQAGDILEAVSQVLGRSPLDFRGAEVLAGQDEGAFGWITVNYLLGRLVQYSSGQWTQPAEGMLLGTLDMGGASTQICFAPSGPILDQSSQATFHLYGANYSVYTHSHLCFGRDQVLLRLLAGLLQSSPASLLRHPCYHSGYQTTLPLATLSESPCVRTAAPLDPTQNLTIEGTGNPGACVTALRGLFNFSCQDHGACAFDGVYQPPVQGQFYVSTGAPSLWARHHWPQDGPQEPWGAQGHRCGRHSFSHPVGILQLLLHLPLPEPHLQAAAGHCQCHGLEILPEALEAGGDQLPWAGALVARLLCLGPVHPHTAAGRLWLPRGELAQHRVPEAGRRDGHWLDAGLHAQPDWHDPSRGTR +>XP_004845071.2_PREDICTED:_pleckstrin_homology-like_domain_family_A_member_1 +MRRAPAAERLAELGFSPRCGRQEPPFPLGVTRGWGGWPIQKRREGARPVPFTERSQEHGRGQAARTSGTWWHIRTRLQLCRDPEPPPLCLLRVSLLCALRAGGRGSRWEEDGARLLLLPPARAAGSGEAEPIGGPPYAGRMLESSGCKALKEGVLEKRSDGLLQLWKKKCCILTEEGLLLIPPKQLQHQQQQQQQPGPGTPEPSQPSCPAVAGLEPPVKLKELHFSNMKTVDCVERKGKYMYFTVVMAEGKEIDFRCPQDQGWNAEITLQMVQYKNRQAILAVKSTRQKQQHLVQQQPPQPQIQPQPQPQPQPQPQPQPQLQPQPQAQPQPKPQPQQLHAYSHPHSHPHPHQHQHPHPLPHPHQPPHSQPLSQPHGHRLLRSTSNSA +>XP_004847201.1_PREDICTED:_trem-like_transcript_4_protein +MTWRGPELMLLPLLLVLLASALGAVARPGCDRGRTCCPGSRVSAAVPKELHAVVGQTLSVRCQYTPQTGPYLRKSWCCQTEEKRCSRVVTTSQPWTTVEELRYTIWDDPHAGFFVINMSDLKEDNSGKYWCGNYNVSINTIFILRNITLVVSPGETSLGKPLVASPEGTPGLSINGSEHSNSSGPFPPDAASPELLFLLQGGLLAVKGLLLSALCTVLCCRDLASFHLPQPDTRIPAFA +>XP_004852934.1_PREDICTED:_protein_FAM154B_isoform_X2 +MRSRCLCQICTCGSDYRPYEIVKQLRHIPEEYKPKQGKIDLGTTYKRDFTSYKVQPVAILRPLERQIKKGKLDTVPTYKDDYRSWDIQKNELHKPEQTYQPSPVKFGNSTTFQDDYVPRETKPRESFKPSSVVRRSTAPFNGDTSHRLDYIPHQLEVKFVRPKQVYKPTDLPFEKLTTHRNDFQGLVGETAKLCRPAYTRVAHDAHFEGSTEFRESFQAWEIPPPKVKKVPEYVPPIGSMQLHSTSHLDYIPYQASRVVPIRPVSHRRNNFPFQGKTTMKEDFPAWESCRPGLIKQEQQIPNPSGKFDGLSTSRSHYVPHELIPTESCRPLNAALKSSVPFDDVTMYSIEYAPKKQEICPASYPTPPGYIFENTDFHGHKFFHKITPAVKAF +>XP_012933047.1_PREDICTED:_G_patch_domain-containing_protein_8_isoform_X2 +MGMGRMEMELDYAEDATERRRVLEVEKEDTEELRQKYKDYVDKEKAIAKALEDLRANFYCELCDKQYQKHQEFDNHINSYDHAHKQRLKDLKQREFARNVSSRSRKDEKKQEKALRRLHELAELRKQAECAPGSGPMFRPTTVAVDEDGGDEDKDESATNSASGAAAGCSLGPEFSTEKGGPFTTVAGTGSTGLPQASGPAAPSVSFGFKNNQGTPLQKLGVSFSFAKKAPVKLESIASVFKDHAEEGSSEEGTKPDEKGSDQGLQKAGDADGGGSTDGKKEDEDPQDGAALASTLSKLKRMRREEGAGVVEPEYYHYIPPAHCKVKPHFPFLLFMRASEQMEGEASSHPKGTPDSKKSGSPKPKGCVRAAPSQAAEPGASERLEPPKEPKETKEATAVAGAEPAQPRGKAEARKVPSGFPGEQGRPVSEAQVRQPEPAKEPSAPGDSVAGRDSQGRPRHPTGPFFPVLSKDESTALQWPSELLIFTKAQPSVSYSCNPLYFDFKLSRNKDARAKGAERAKDAGGPSREALPGPEASGPGGDKDAGEPQADGGPPAAAAAPLAPAREPEPEPQDTGQSLAGRKERRGRTHRHKKRKKHKKSGRHKRRHKADADEKGSGSRADPGDKSRKRKKRKRKKKSGGAADSERGPKPEPPGSGSPAPPRRLRRHDESQRRPLPAADESGGGQRDAGGGAQERGGRRQPGEPPATSCQRRASAPRTGNTHRHGRPSSGEEDSDGGAARRPRQESPAQYSDEDDDDEEEEDSGSARSRSRSRSRRRSSRRSYSSSSAASSDQSCYSRPRSYSDDSYSDYSERSRRHSKRSHGSDDSDYASPKRRKYSSSEDDDYSLSGSPSRSRSRSRSRERSPTRSRSSSHSRSQRRSRSTTAHSWQRSRSYSRDRSRSTRSPSQRSGSRKGSWGHDSPENRRSSRRDFIRSKIYRSQSPHYFWSGRGDCPGKKDDSQGDDSKASGPPSQNSSTGTGRGSESDCGPEDKNSVTARLLLEKVQSRKGERKPSMGEEVLATPNKAGLKLKDPPQGYFGPKLPPSLGSKPVLPLIGKLPTTRKPNRKCEESGVEKGEEQDQSETEEGPPGSGCQVPAEDTAGPLSELPPGEPTSKEATAAYPVAPLGAPAHSDCYPGDPASSHSYLPDPSNGDTLEPPESGSQPGPVDAGLLPAAPDLEHFPGYAPPSREPRGESPEGAEDASLAPLESQPITFTPEEMEKYSKLQQAAQQHIQQQLLAKQAKAFPASAALAPAAPALQPIHIQQPAAASATSITTVQHAILQHHAAAAAAAAIGIHPHAHPQPLAQVHHIPQPHLTPISLSHLTHSIIPGHPATFLASHPIHIIPASAIHPGPFTFHPVPHAALYPTLLAPRPAAAAATALHLHPLLHPIFSGQELQHPPSHGT +>XP_012928014.1_PREDICTED:_protein_phosphatase_1_regulatory_subunit_29 +MLRLGLCAAALLCVCRPGAVRADCWLIEGDKGYVWLAICSQNQPPYETIPQHINSTVHDLRLNENKLKAVLYSSLNRFGNLTDLNLTKNEISYIEDGAFLGQSSLQVLQLGYNRLSNLTEGMLRGMSRLQFLFVQHNLIEVVSPTAFSECPSLISIDLSSNRLSRLDGATFASLASLMVCELAGNPFNCECDLFGFLAWLVVFNNVTKNYDRLQCESPREFAGYPLLVPRPYHSLNAITVLQAKCRNGSLPARPVSHPTPYSTDAQREPDENSGFNPDEILSVEPPASSTTDATTGPAIKLHHVTFTSATLVVIIPHPYSKMYVLVQYNNSYFSDVMTLKNKKEIVTLDKLRAHTEYTFCVTSLRNSRRFNHTCLTFTTRDPVPGDLAPSTSTTTHYIMTILGCLFGMVIVLGAVYYCLRKRRMQEEKQKSVNVKKTILEMRYGADVDAGSIVHAAQKLGEPPVLPVARMSSIPSMIGEKLPTSKGLEAGLDTPKGATKGNYIEVRTGAGGDGLARPADDLPDLENGQGSAAEISTIAKEVDKVNQIINNCIDALKLDSASFLGGSSGGGDPELAFECQSLPAATATSTAAAPGALERPSFLSPPYKESSHHPLQRQLSADAAVTRKTCSVSSSGSIKSAKVFSLDVPDHPAASGLAKGDSKYIEKGSPLNSPLDRLPLVPTGSSGGSSGGGGIHHLEVKPAYHCSEHRHSFPALYYEEGPDSLSQRVSFLKPLTRSKRDSTYSQLSPRHYYSGYSSSPEYSSESTHRIWERFRPYKKHHREEVYMAAGHALRKKVQFAKDEDLHDILDYWKGVSAQQKL +>XP_012924869.1_PREDICTED:_tetratricopeptide_repeat_protein_6-like +MSWNRSEMTMFTLLAKAQMKAKKIKEAVRMFKKALEVFSHSDKGPNAVAISVDCLHNLGLCYMEEGNLQMAFDCFTKAVKANPDFAEGFYQRGLCKVKLQGDNSILDFNRAIALNPRHYQAYLRRVAFYGLKGRYSKAILNCNEAIKIYPQSVCAYLCRGVLKYYSMNYKLAIRDLTIAVNMDKSSYAAFYNRALCYTKIRELQMALIDFGIVLLLDAGETITLNTFINRGLIYTKLEQYGFALEDFKQAASISQTDVSLCQASAMCHHRIQEFKEATDFFTQALKINPLFLDAYTGQRNSYMGYGHEATKQAQKDFLKALHLNPLCTKARISLCYNLQAQGKLQKAWKHFTITMEIDPNSYLAYEGRAVVCLQMGINFAAMQDINAAIKINTTAEFLTNRGVIHEFMGQQQSVMKDYQAAIALDPKYSLAYFNAGNIYFHHRQFSQASDYYSKSLKFDPENEYVLMNRAITNTILNKYEEAKEDFAYVIERCPFWAAVYFNRAHLYCCLKQYDLAEEDLSRALSLKPNDVLVCNLRAEVRGKMGLIEEAMADYNQALDLEEYASVT +>XP_004859657.1_PREDICTED:_sorting_nexin-11_isoform_X2 +MLENPEQEEVITVRVQDPRVQNEGSWNSYVDYKIFLHTNSKAFTAKTSCVRRRYREFVWLRKQLQRNAGLIPVPELPGKAPFFGSSDEFIEKRRQGLQHFLERVLQSVVFLSDSQLHLFLQSQLSVPEIEACVQGRSPTTVADAILLYAMSNCGWAQEERLGVAGQAQGDQPNSCCFLPRSGRRASPSPPPRDGQDRLAVWAPVVDSEAPSLESPALPLSSSPPCCGCTRPDTDEGRCAPQPARTAEGADHAVPLDAGQLDAVWEN +>XP_012927920.1_PREDICTED:_microtubule-associated_protein_4_isoform_X16 +MADLSLADALTEPPPEIEEEIKRDFMATLEAEAYDDVVGETVGKTDYIPLMDGDEKTGSLESKRKPCSDTSQVEGTPSSKPTVLANGDHAIEGNDTTGYPAGFLDETMTFQEYQNSQNWPEDADFCFQPGEVVNPIQTDPFKMHHDDNLADLLFLSSGTTNVPVLMGQNDPQEDSYDMSSCDTFAPATIAPHGWSMPAPNSAHSESFVSPEDFGEPPQPAAELAKEIDLPSVEEQLLTNALDIMTGQKSTDMAPSRETEVVLANVMGPATETKVASAKGTEQPSKLDVALVENTQPSIESDTSLAKDMALLTETQAAAMKDMVLPTEPEAAPSKGVTESTPLVPKDLAPQQAIVPPTDTQITVAMGVMSLSETEAELAKDSVSSMEISPAMEMALSSEAEVALARDVALSPEALVVFTEDVALSLGTEGASVKDMAPPLETEMGLGKDMTSPLESKVGLGKDMAVLQETEMAPTKDMATPQETEVALGNDVILPPDAEVSQVKDVTPLLEKDAALPPQTKVALGKDAVLPSGTDVMLANNVTPVKDVTPPLETEVAAVLKDTEMAQSQKGLSEDPQLESLQSEAPAAPGLISAEPIKASGQKYSLPTDEDFGLEKLEQKKPLNSQPSEPSSATSGIARPEEGKAAVSVTGNDISTPPNKELPPSPEKKAKPLATIQPAKTATSKAKTQLTPVPKQPAPATSGGANKKPMSLASGLVPAAPPKRSAAATARTSTLSSRDAKPKHIAEAKVSEKQALPSKPASALTLRPGPKTTSAAPKVESAAAPASLGPSSRSPPALLSKRPAAIKTEGKPADAKKTVAKSAPADLSRSKSIPTSSVKKTTTHAGAAPTAAAALTRVKPTPLSRPTMSPSMDKKPTTTKPSSSAPKLSRPATAAPAPDLKNVRSKVGSTENIKHQPGGGRVQIVSKKVSYSHIQSKCGSKDNIKHVPGGGNVQIQSKKVDISKVSSKCGSKANIKHKPGGGDVKIESQKLNFKEKAQAKVGSLDNVGHLPAGGSVKTEGGGNEAPPCPGLPAGEEPAGSEAAPDAGAPTPAGGLSGLPTLSGGGDQREAQTLDSQIPETMSRKPEDPQRPT +>XP_004865045.1_PREDICTED:_lysophospholipid_acyltransferase_LPCAT4 +MRQGSPGDSAPREPAPGDPALPNPFVHELHLSRLQQVKFCLLGVLLAPIRVLLAFIILFLLWPFAWLQVAGLTEEQLQEPITGWRKTVCHNGVLGLSRLLFFLLGFLRIRVRGQRASRLQAPVLVAAPHSTFFDPIVLLPCDLPKVVSRAENLSVPVIGALLRFNQAILVSRNDPASRRRVVEEVRRRATSGGKWPQVLFFPEGTCSNKKALLKFKPGAFIAGVPVQPVLIRYPNSLDTTSWAWRGPGVLKVLWLTASQPCSIVDVEFLPVYQPSPEESRDPTLYANNVQRVMAQALGIPATECEFVGSLPVIVVGQLKVALEPQLWELGKVLRKAGLSPGCVDTGAEPGRSRMISQEEFARQLQLLDPQTVAGAFSYFQQDSSGLVDFRDVALALAALDGGRSLEDLTHLAFELFAEEQAEGSGRLLYQDGFSTILHLLLGSPRPAAMTLHAELCQAGPSHGLSLDQFQNFSLRDLLYGKLFSTYLRPPHTPRGTSQVPDASSPQSPSALANGTLQAPKQKED +>XP_004864008.1_PREDICTED:_sialin_isoform_X2 +MRPSASRLAASYGEDGADSTPLLLGARRADAAPVCCSARYNLAILSFFGFFVLYALRVNLSVALVEMVDSNTTAADNRTSKECAEHSDLVKVPHNQTGKRYPWDAETQGWILGAFFYGYIITQIPGGYFASKIGGKLLLGYGILATSLFTLLTPIAADLGAVMLIMLRALEGLGEGVTFPAMHTMWSSWAPPLERSKLLSISYAGAQLGTVVSLPLSGIICYYMNWTYVFYFFGILGILWFILWTWKVSDTPETHKTISSYEKEYITSSLKSQLSSRKSVPWIPILKSLPLWAIVMAHFSYNWTFYTLLTLLPTYMKEILRFNVQENGFLSALPYFGSWLCMILSGQAADSLRAKWNFSTLCVRRTFTLIGMIGPAVFLVAAGFIGCDYSLAVTFLTISTTLGGLCSSGFSINHLDIAPSYAGILLGITNTFATIPGMVGPVIAKSLTPEDTITEWQTVFYIAAAINVFGAIFFTLFAKGEVQIWAFGDHHGHRN +>NP_001280672.1_antizyme_inhibitor_2 +MAGYLSESDFVMVEEGFSTRDLLEELTLEASQATTGEVAAFFVANLGAIVRKHFCFLKCLPRVRPFYAVKCNSSLGVLKVLAELGLGFSCVNKAEMELVQRVGVPASKIIYANPCKQIAQIKYAAKHGVQLLSFDNEVELAKVVKNHASAKMVLCIATDDTHSLSFLSLKFGALLKSCRHLLENAKKSHMEVVGVSFHVGSGCPDPQVYAQSIAEARLVFEMGAELGHTMHILDLGGGFPGVERTKVRFEEIASVINSALDLYFPEGCGVDILAELGRYYVTSAFTVAVSIVAKKEVLLDQPNREEENGSALKTIVYHLDDGVYGIFNSVLFDNICPTPLLQKKPPTEQPLYSSSLWGPAADGRDCVAEGLWLPQLHIGDWLVFENMGAYTVGTGSLLGGTQTCHITYAMSRVAWEALRGQLLPVEQDEDAEGVCKPLSCGWEITDTLCVGPVFTPASIM +>XP_004840043.1_PREDICTED:_DNA-directed_RNA_polymerase_III_subunit_RPC9_isoform_X2 +MEVKDGNSVLLSNYEVFQLLTDLKEQRRESGKNKHSAGQQNLNTITYETLKYLSKTPCRHQSPEIVREFLTAMKSHKLTKAEKLQLLNHRPVTAVEIQLMVEETEERFTEEEQIEELLHTVMSVLPAEPEAEQKTDASGDVEMNEEGRA +>XP_004850942.1_PREDICTED:_fibronectin_type_III_domain-containing_protein_5_isoform_X3 +MPPGPPCAWPPRGALRLWLGCVCFALVQADSPSAPVNVTVRHLKANSAVVSWDVLEDEVVIGFAISQQKKDVRMLRFIQEVNTTTRSCALWDLEEDTEYIVHVQAISIQGQSPASEPVLFKTPREAEKMGSKNKDEVTMKEMGRNQQLRTGEVLIIVVVLFMWAGVIALFCRQYDIIKDNEPNNNKEKTKSASETSTPEHQGGGLLRSKI +>XP_004869941.1_PREDICTED:_olfactory_receptor_1030 +MKQNYTVVTEFILLGLTDRAELQPLLFVVFLVIYIVTIIGNVTMIVLIRSDSKLHTPMYFFLSHLAFVDLCYATTVTPQMLVNFLSKRKIISFIGCMIQFNFFIAFVITDYYVLAAMAYDRYVAICQPLLYGSKMSRCVCVSLVVATYIYGFANGLVQTILMLRLTFCGPNEINHFYCADPPLMVLACSDTYVKETAMFVVAGSNLTCSLSIILVSYVFIFAAILHIRSAEGRRKAFSTCGSHLTAVTVFYGSLFCMHLRPPSETSVEQGKIVAVFYIFVSPMLNPLIYSLRNKDVKRAIRKVIQKELFVK +>XP_012931139.1_PREDICTED:_treacle_protein +MAEARKRRELLPLIYQHLLHAGYVRAAREVKEQSGQKSFLAQPFTLLDIYTHWQQTSEIGQKRKAEDDAALQAKKTRVSDPISSSESSEEEEEEEEEAEAKAAKTTPRPASTNSSAMGMVLPSSMKEKAKAKTRNTSKTVNSVPHLASGKAVVHLLSGKSPKKSAELSGSTVLVSETEEEGSIQALEAAAKPGTVSAGQADNSNKDTSSSSDETDVEVKSSVETSQVRPSLTLAKESSASKAAPSPGKVGGVARQARGGALTPAGSAVKPEEEPPTGAPSQVKASEKILQVRLAPASAKGTPGKQATCALPGKGGPLATQAKARRPEQDSESSSEGESDSEVETPPVMTALQAKLSGKTLQVRAASAPAKESPRKGHPPATPGKTGPAATQAQVGKQEEDSDSSSEESDSDGETPAAQTLAKPSGKILQVRPASGPTKGLLGKGAAPKPPQKSGPVAIQVKAEKSKDDSESSEESSDSEEEAPAAVTPAQAKPELKMPQTKASPSKSILLTPTSAKGAPVRVGTPAPWKAGTVASASSSALPRGAQRPKDNSSSSEEESEGKEATPAAAVAQAKSLGKGLRGQAASAPTMGPSGQGATPVPPGKTRPTVAQVRAEAHESSESSEEESDDSEVGAVVTPAQAKAPGKTPQAKANPASTKASTDKEAAWTPAKLVTAVVQAKPGSMAKGKSPVRAPKNSTISARGQASVPASGKAVTAAAQSQKGPTQESEEKDLESSEESSESEEELPTQAKPSGKTLQVRAATAPAKESSRKGPSPTTPGKTGPAGTQAQVGKQEEDSDSSSEESDSDGETPAAQLKPLGKTPQVKAASATANGSPRKGAPPAPPGKTGPAAIQAQVQSQLWKVLSRAEVPISGAVGHASPAAVRVHVCVQKPASRLPSANTLHMLLQVLSLQKNINSKTVGSNTLTPAPREKSPEGSSESSEEELPSSQVIKTPLIFVDPNRSPAGPAATPTQAQAASPPRKARASSSTAGSSSEGEDEDVIPATQSSTLAVRKEVVTVPTASPRMAPRASSSLESSRVSPGQKQEAAAPQVTKRNLASLPLTQAALKVLAQKASEGQPSSEAGSDAGTLPVTCPQSNPVQARVTNKLRKPKPSEGQQTTVTTSGHLKATAPGSSDNSDDSSDNSSGSEEDAEEPLMTKSAPGLGPSPSKRETLVEETTAESSEDEVVVPSQSLLSGFVTPGLTMANNRASKATARQNLHPSLSSPPPTKDDPAGKQAAESQHIAGAVSPKPGRKEAASGPTPQKPRKPKKGPLSTSASLQTLQSNITQHLQGQPWPLNEAQVQASVVKVLTELLEQERKKAEDTARESSRKGRKRKLSGDQVASRAPKGKKKKQLAAGEGREDAASSEKAPRTSKGKSKRDKASGDLKEEKGSGSGGSKDKPDGELLKVESGNQNDSKSKKEKKKSNKKKKDKEKKEKKKGKKPSAKDSDSPFQKKKKKKKKTAEQTV +>XP_004868708.1_PREDICTED:_KAT8_regulatory_NSL_complex_subunit_1_isoform_X1 +MAAMAPALTDAAAEAHHIRFKLAPPSSTLSPGSAENNGNANILIAANGTKRKAIAAEDPSLDFRNNPTKEDLGKLQPLVASYLCSDVTTVPQKESLKLQGVFSKQAVLKSHPLLSQSYELRAELLGRQPVLEFSLENLRTMNPSGQTALPQAPVNGLAKKLTKSSTHSDHDISSPLNGGKRAPTSSALQGGEVGGSDSGDLKGGMTNCTLPHRSLDVEHTTLYSNNSTANKSSVNSVEQLALQGSSRLSPGTDSSPNLGSVKLEGKKSPMSSILFSALDSDTRITALLRRQADIESRARRLQKRLQVVQAKQVERHLQHQLGGFLEKTLSKLPNLESLKSRSQLMLTRKAEAALRRAASETTTSEGLSNFLKSDSISEELERFTASGIANLRCSEKAFDSDITDSSSGGESDIEEEELSRADSEQCHIPLKRRSEWRWAADRAAIVSRWNWLQAHVSDLEYRIRQQTDIYKQIRANKGLIVLGEASPPEHTTDSLLPLGSEVKTDHGTDKLIESVSQPLENHGPSVGHISESLSAKSCGALRPVNGVINTLQPVLADHVPGDSSDAEEQLHKKQRLNLVSSSDGTCVAARTRPVLSCKKRRLVRPNSIVPLSKKVQRNSITRSGCDVNTSCALCGSGSVNTMPPEIHYEAPLLERLSQLDSCIHPVLAFPDDVPTSLHFQSMLKSQWQNKPFDKIKPPRKFSLKHRTPMQGSLTDPTRKDRHKLVNSFLTTAKLSHHQTRPDRTHRQQLDDVGAVPMVERVTVPKAERLLNPPPPVHDPNHSKMRLRDHSSERSEVLKHHTDISNSSYLATTHHTPHSPLVRQLSTSSDTSAPTSSSSQVSASTSQPVRRRRGESSFDINNIVIPMSVAATTRVEKLQYKEILTPSWREVDLQSLKENPEEENEEIEDLSDAAFAALHAKCEEMERARWLWTTSVPPQRRGSRSYRSSDGRTTPQLGSANPSTPQPASPDVSSSHSLSEFSHCQSPRSPISPELHSAPLTPVARDTLRHLASEDTRCSTPELGLDEQSVQPWERRTFPLPYSPQAECEDQLDAQERAARCTRRTSGSKTGRETEVAPTSPPIVPLKSRNLAATVTAQRPTHR +>XP_004871686.1_PREDICTED:_caspase-10 +MASRGGSLGSSSDEDSSMSFREKLLRINLSLGAQDVEGMKFLCMGLVFEKRLERSSSASDLFDLLLEEELLSEDNAFFLAELLYSIRQNSLLRHLGYTRECVEQWLPTRRRLSLFRNLLYELSEAIDSEKLKDMTFLLQDHIPKTQMTSLSLLACLEKQTLIDEDNLRLLEKVFKSVAPNLVKKIENYKRERAAQEAMPPTDRETESLHQGEEEVFSHSDIKQLVQALPEVDVYRMDRKHRGHCVIINNHSFEGLNERTGTHMDAEYLRRVFQWLGFTVHMHHDVTREGMEKILREQRSHPGHADGDCFVFCILTHGKLGAVYSSDKALIPLREITSHFTAQQCQALAHKPKLFFIQACQGEAMHPSVLIEADALNPECVSPSLQGSIPEEADFLLGLATVPGYVSFRHKEKGSWFIQSLCNHLKNLVPRRQDILSILTAVNQDVSQQADASGRKKQMPQPAFTLRKKLVFPVPSEAL +>XP_004873541.1_PREDICTED:_protein_FAM156A/FAM156B +MDPLQKWNPGLISGSSQMPTTETSQEGAAASQPSSSEQLMMGLSDLSISPGSNPAVPLQEGLFQQQHREKTLLEQHWERLGFPQKKKAFLGHFRRRHRDHMAPYPVERETRISFPGDRAQNQFRCQCRYCQGHMPNISGVTGERNGNPSPSSWETLVQGLSGLTLSLGTNRPGIQPGGVQQQQQQQQQQQQQQQQQEPEEKLQLERQQESKNMFQRLFKQWLEEN +>XP_004856768.1_PREDICTED:_transmembrane_protein_25_isoform_X7 +MCRPCVHVCVCVRVCVCVCVCVVRLRSCPLLLCTFVCDVCPLQSVLGSVPAGAQSKFLKELLGLPALTWLTPRPPHSLSRPAPALATMGLPPGPATLPHTLLFLPALLSSGWGELAPQIDGHTWAERALQENERHAFTCRVAGGPGTPRLAWYLNGQLQEASTSRLLSVGGEAFSGGTSTFTVTAHRAQHELNCSLQDPGSGRSANASVILNVQFKPEIAQVGAKYQEAEGPGLLVVLFALVRANPPANVTWIDQDGPVTVNTSDFLVLDAQNYPWLTNHTVQLQLRSLAHNLSVVATNDVGVTSASLPGPVTLTT +>XP_012931108.1_PREDICTED:_E3_ubiquitin-protein_ligase_PDZRN3_isoform_X2 +MGCSLCSLQKQEEQYKLLYEVCQVNGKDLSRATHDQAVEAFKTAKEPIVVQVLRRTPRTKMFTPPAELQLVDTGTQTDITFEHIMALTKMSSPNSPVLDPYLLPEEHPSAHEYYDPNDYMADIHQEMDREELELEEVDLYRLSSQDKLGLTVCYRTDDEDDIGIYISEIDPNSIAAKDGRIREGDRIIQINGIEVQNREEAVALLTSEENKNFSLLIARPELQLDEGWMDDDRNDFLDDLHMDMLEEQHHQAMQFTASVLQQKKHEEDGGTTDTATILSNQHEKDSGVGRTDESTRNEESSEQENNGDDATASSNPLAGQRKLTCSQDTLGSGDVPFSNESFVSADCTEVDYLGIPVDECERFRELLELKCQVKSASPYSLYYPSSPLDATKSDPESVDKELELLNEELRSIELECLSIVRAHKMQQLKEQYREPWLLHHGGFRNYNTSLDVRRHELSDITELPEKSDKDSSSAYNTGESCRSTPLTLEISPDNSLRRAAEGLSCSGSEGAGAMGTAEGYGPSPKNLLAITEDPEVGTPNYNPSAKELDPSQPLESKERRATEGGRSPLGSPKLGGAYLSSSPHSPYKHAHIPAHAQHYQSYMQLIQQKSAVEYAQSQMSLVSMCKDLASSNSSEPRMEWKVKIRSDGTRYITKRPVRDRLLRERALKIREERSGMTTDDDAVSELKMGRYWSKEERKQHLVKAKEQRRRREFMMQSRLDCLKEQQGADDRKEMNILELSHKKMMKKRNKKIFDNWMTIQELLTHGTKSPDGTRVYNSFLSVTTV +>XP_004849533.1_PREDICTED:_BMP/retinoic_acid-inducible_neural-specific_protein_1_isoform_X1 +MNWRFVELLYFLFVWGRISVQPSHQEPAGTDQHVSKEFDWLISDRGPFHHSRSYLSFVERHRQGFTTRYKIYREFARWKVRNTAIERRDLVRHPVPLMPEFQRSIRLLGRRPTTQQFIDTIIKKYGTHLLISATLGGEEALTMYMDKSHLDRKSGNATQSVEALHQLASSYFVDRDGTMRRLHEIQISTGAIKVTETRTGPLGCNSYDNLDSVSSVLLQSTESKLHLQGLQIIFPQYLQEKFVQSALSYIMCNGEGEYVCQNSQCRCQCADEFPQCNCPVTDIQVMEYTLANMAKSWAEAYKDLENSDEFKSFMKRLPSNHFLTIGSIHQHWGNDWDLQNRYKLLQSAMEAQRQKIQRTARKLFGLSVRCHHNPIHQLPRERTIQQWLARVQSLLYCNENGFWGTFLESQRSCVCHGSTTLCQRPIPCIIGGNNSCAMCSLANISLCGSCNKGYKLYRGRCEPQNVDSERSEQFISFETDLDFQDLELKYLLQKMDSRLYVHTTFISNEIRLDTFFDPRWRKRMSLTLKSNKNRMDFIHMVIGMSMRICQMRNSSLDPMFFVYVNPFSGSHSEGWNMPFGEFGYPRWEKIRLQNSQCYNWTLLLGNRWKTFFETVHIYLRSRTRLTTLLRNDTGQGPVDLSDPSKRQFYIKISDVQVFGYSLRFNADLLRSAVQQVNQSYTQGGQFYSSSSVMLLLLDIRDRINRLAPPVAPGKPQLDLFSCMLKHRLKLTNSEIIRVNHALDLYNTEILKQSDQMTAKLC +>XP_004856078.1_PREDICTED:_linker_for_activation_of_T-cells_family_member_1_isoform_X2 +MEVSSLVLTEPLGLLLLPLVAMLLMALCVRCRELPASCGGADEDRSHTESILFKPPQAPAPWPAAYPPPSQVDLLHIPRSPQPLGGSHRMLSSRQDSEGANSVASYENQEPACEDADEDDLEEEEDYPNEGYGGYVEVLPDSAPASGAADPAEAPVPSNPGARGSAFSMEFREDYVNVPESEESAEVSLDGSREYVNVSQELQPGARTEPAALSSRDVEDEDEDEDEETPDYENLQELS +>XP_012922077.1_PREDICTED:_ral_GTPase-activating_protein_subunit_alpha-1_isoform_X5 +MFSKKPHGDVKKSTQKVLDTKKDALTRLKHLRIVIENAESIDLKQFFDQHFSHIYYVFFENFVTIEASLKQKGHKSQREELDAILFIFEKILQLLPERIHQRWQFHSIGLILKKLLHTGNSLKIRREGVRLFLLWLQALQNNCSREQLWMFSCLIPGFSAPQSEHGPRTLDNLINPPLNLQETQVTIEEITPLVPPQSGDKGQEDLTSYFLEALLKYIVIQVKSLEWKNKENQERGFSFLFSHFKKYYLPYIFPNICKENSLYHPALDIPQIRPKPHYVMIKKDAETNEAIYCTKEPFIKARVIVIRWLVSFWLEPKPHAGPHIPGMEGEVLPKNIQRAAASLVSREENRNDNGDKGDRTTEPEQSHSNTSTLTEREPSSSSLCSIDEEHLTDIEIVRRVFSSKRSNVNFVTEIFRQAFLLPICEAAAMRKVVKVYQEWIQQEEKPLFMQEPEEIMITSSDIPCIENAKDHDISVEEGEKREEENGTSMAEHVRNSGWPKTGSYQDPLHNASEEATEQNIRAGTQAVLQVFIINSSNIFLLEPANEIKNLLDEHTDMCKRILNIYRYMVVQVSMDKKTWEQMLLVLLRVTESVLKMSSQAFLQFQGKKNMTLAGRLAGPLFQTLIVAWIKANLNVYISRELWDDLLSVLSSLTCWEELATEWSLTMETLTKVLARNLYSLDLSDLPLDKLSEQKQKKHKGKGVGHEFQKVSVDKSFSRGWSRDQPGQAPMRQRSATTTGSPGTEKARSIVRQKTVAMRSRSIGECALPSAYIRSAKSAPVLIHTSKPFLPDIVLTPLSDELSDIDDAQIHPRSTRVRHFSQSEDTGNEVFGALNEEQPLPRSSSTSDILEPFTVERVKVNKEDMSPKLPPLNSDIGSSSANVPDLMDEFIAERLRSGNALNMTRRGSSPGSLEIPKDLPDILNKQNQMRPIDDPGVPSEWTSPASAGSSDLISSDSHSDSFSAFQYDGRKFDNFSFGGDPGIASSADVDSFSGHHQSAEEQEVASLTTLHIDSETNSLNQQAFSAEVATVTGSESASPVHSTLGSRSQTPSPSTLNIDHMEQKDLQLDEKLHHSVLQTPDDLEISEFPSECCSVMAGGTLTGWHADVATVMWRRMLGILGDVNAIMDPEIHAQVFDYLCELWQNLAKIRDNLGISTDNLTSPSPPVLIPPLRILTPWLFKATMLTDKYKQGKLHAYKLICNTMKRRQDVSPNRDFLTHFYNIMHCGLLHIDQDIVNTIIKHCSPQFFSLGLPGATMLIMDFIIAAGRVASSAFLNAPRVEAQVLLGSLVCFPNLYCELPALHPNIPDIAVSQFTDVKELIIKTVLSSARDEPSGPARCVALCSLGIWICEELVHDSHHPQIKEALNVICVSLKFTNKTVAHVACNMLHMLVHYVPRLQIYQPDSPLKIIQILIATITHLLPSTEASSYELDKRLVVSLLLCLLDWIMALPLKTLLQPVHAAGTENDKTEKSVLNCIYKVLHGCVYGAQCFSNPRYFPISLSDLASVDYDPFMHLESLKEPEPLHSPDSERSSKLQPVTEVKTQMQQGLISIAARTVITHLVNHLGHYPMSGGPAMLTSQVCENHDNHYSESTELSPELFESPNIQFFVLNNTTLVSCIQIRSEESMPGGGLSAGLASANSNVRIIVRDLSGKYSWDSAILYGPPPVNGLSEPTSFILSLSHQEKPEEPPTSNECLEDIIVKDGLSLQFKRFRETVPTWDTIRDEEDVLDELLQYLGVTSPECLQRTGISLNIPAPQPVCISEKQENDVINAILKQHTEEKEFVEKHFNDLNMKAVEQDEPVPQKPQSAFYYCRLLLSILGMNSWDKRRSFHLLKKNEKLLRELRNLDSRQCRETHKIAVFYVAEGQEDKHSILTNIGGSQEYEDFVAGLGWEVNLTNHCGFMGGLQKNKSTGLTTPYFATSTVEVIFHVSTRMPSDSDDSLTKKLRHLGNDEVHIVWSEHTRDYRRGIIPTEFGDVLIVIYPMKNHMFNIQIMKKPEVPFFGPLFDGAIVNGKVLPIMVRATAINASRALKSLIPLYQNFYEERARYLQTIVQHHLEPTTFEDFAAQVFSPASYHHLPSDADH +>XP_012934276.1_PREDICTED:_zinc_finger_and_BTB_domain-containing_protein_44_isoform_X3 +MGVKTFTHSSSSHSQEMLGKLNMLRNDGHFCDITIRVQDKIFRAHKVVLAACSDFFRTKLVGQAEDENKSVLDLHHVTVTGFIPLLEYAYTATLSINTENIIDVLAAASYMQMFSVASTCSEFMKSSILWNTPNSQPEKSIDAGQENSNCNFTSRDGSISPVSSECSVVERTIPVCRESRRKRKSYIVMSPESPVKCSTQTSSPQVLNSSASYTENRNQPVDSSLAFPWTFPFGIDRRIQSEKTKQAENTRALELPGPSEAGRRMTDCVTCESTKASLPLGTEEDIRVKVERLSDEEVHEEVSQPVSASQSSLSDQQTVPGSEQVQEDLLISPQSSSIGSVDEGVTEGLPTLQNTSSTNVHVDDDDRTERPSPNGPDRPFQCPTCGVRFTRIQNLKQHMLIHSGIKPFQCDRCGKKFTRAYSLKMHRLKHEVIS +>XP_012922460.1_PREDICTED:_guanylate_cyclase_soluble_subunit_beta-1_isoform_X3 +MAPRRGRTSISREQVEEDHFRKKSLSKIRQRERIQQMESRRKEKEAQLDEEGQFLVRIIYDDSKTYDLVAAASKVLNLNAGEILQMFGKMFFVFCQESGYDTILRVLGSNVREFLQNLDALHDHLATIYPGMRAPSFRCTDAEKGKGLILHYYSEREGLQDIVIGIIKTVAQQIHGTEIDMKVIQQRNEECDHTQFLIEEKESKEEDFYEDLDRFEENGTQESRISPYTFCKAFPFHIIFDRDLVVTQCGNAIYRVLPQLQPGNCSLLSVFSLVRPHIDISFHGILSHINTVFVLRSKEGLLDVEKLECEDELTGTEISCLRLKGQMIYLPEADSIVFLCSPSVMNLDDLTRRGLYLSDIPLHDATRDLVLLGEQFREEYKLTQELEILTDRLQLTLRALEDEKKKTDTLLYSVLPPSVANELRHKRPVPAKRYDNVTILFSGIVGFNAFCSKHASGEGAMKIVNLLNDLYTRFDTLTDSRKNPFVYKVETVGDKYMTVSGLPEPCVHHARSICHLALDMMEIAGQVQVDGESVQITIGIHTGEVVTGVIGQRMPRYCLFGNTVNLTSRTETTGEKGKINVSEYTYRCLMSPENADPQFHLEHRGPVSMKGKKEPMQVWFLSRKNAGAEVGVETSQEDD +>XP_004864119.1_PREDICTED:_cathepsin_G +MQPLLLLLALILLPGAKAGKIIGGQEARPHSHPYMAYLQVESPEGLSSCGGFLVREDFVMTAGHCWGSAINVTLGAHNIEKQERTQQQVTVLRAIRHPRYNEKNAQNDIMLLQLRNRITRNRFVRPVALPNAREKPRPGALCTVTGWGWINLHEWSDKLQEVQLRVQSNRKCTRRFPSYSSRIQICVGDPRQRKAAFKGDSGGPLVCNSVVQGIVSYGDKERGTTPEVFTRISSYLPWINRTMRCFQTAESD +>XP_004861216.1_PREDICTED:_mitochondrial_inner_membrane_protease_ATP23_homolog_isoform_X3 +MARAGDGRGPCSAAGEQPLNQQQQQQQGTSQVYPERLAEGRPQQGLFSRFLTHNQKCQLMLLKTLETNPYVKLLLDAMKHSGCAVNKERHFSCEDCNGNVSGGFDASSSQIVLCQNNICNQAHMNRVVTHELIHAFDHCRAHVNWFTNVRHLACSETCVRDRAILSILAVRNISKEVAEKAVDEVFESCFNDHEPFGRIPHNQTYARYAHRDFQNRDRYYSNI +>XP_012929719.1_PREDICTED:_rho_guanine_nucleotide_exchange_factor_10-like_protein_isoform_X2 +MASSNPPAQPAVAKAAESLPWARPGCDCKGGQPFFPPGDLLVPAAPGPSPEVEDPGEAFEFDDSDDEEDTSTGLGVPCLAPERNEPLLIHFDSTLGSDLDPATAPPQTEVPAVVSNGDAVDVVFSGVQRSSWKRKSSRRIDRFSFPALEEDVIYDDVPCESPDAHQPGAERNLLYEDVQRAAREPEDLGWSSSEFESYSEDSGEEAKPEAEPAKHRVSFQPKLSPDLTRLKERYARTKRDILALRVGGRDMQELKHKYDCKMTQLMKAAKSGTKDGLEKTRMAVMRKVSFLHRKDVLGDSEEEDMGLLEVSVTDIKPPAPELGPMPDGLSPQQVVRRHILGSIVQSEGSYVESLKRILQDYRNPLMEMEPKALSVRKCQVVFFRVKEILHCHSMFQIALSSRVAEWDSTEKIGDLFVASFSKSMVLDVYSDYVNNFTNAMSIIKKACLTKPAFLEFLKRRQVCSPDRVTLYGLMVKPIQRFPQFILLLQDMLKNTPRGHPDRLSLQLALTELETLAEKLNEQKRLADQVAEIQQLTKSVSDRSSLNKLLTSGQRQLLLCETLTETVYGDRGQLIKSKERRVFLLNDMLVCANINFKGQLEISSLVPLGPKYVVKWNTELPQVQVVEVGQDGGAYDKDNVLIQHSGAKKASATGQAQNKVCLGPPRLFQELQDLQKDLAVVEQITLLVSTLHGTYQNLNMAVAQDWCLALQRLLRVKEEEIHSANKCRLRLLLPGKPDKSGRPISFMVIFITPNPLSKISWVNRLHLAKIGLREENQPGWLCPDEDRKSKAPFWCPILACCVPAFSSRALSLQLGALVHSPVNCPLLGFSAVSTSLPQGYLWVGGGQEGAGGQVEIFSLNRPSPRTVKSFPLAAPVLCMEYIPEPEEDPEGRQESRVSADPSAGTVHPTICLGLQDGSILLYGSVDTGTQCLASCRTPGLQPVLCLRHSASYLLAGLQDGTLAAYPHSSGGVPWDLESLPMCLTVGPGPVRTLLSLEDAVWASCGPRVTVLDGTTLQTQQSFDAHQDEEVSVTHMVKAGSGVWMAFSSGSSIRLFHTETLEHLQEINIATRTTFLLPGQKRLCVTSLLICQGLLWVGTDQGVIVLLPVPRLEGIPKITGKGMVSLNGHCGPVAFLTVATSILAPDILRSDQEEAEGPRAEEDKLDGQGQELAPAPNSHMGRELTRKKGILLQYRLRSTAHLPGPLLSMREPEPGDSSALEHSEEDGSIYEMADDPDVWVRSRPCTRDAHRKEICSVAIISGGQGYRNFGSALGSSGKPALCGDSDSTLLIWQVPLML +>XP_004839118.1_PREDICTED:_rho-related_GTP-binding_protein_RhoB +MAAIRKKLVVVGDGACGKTCLLIVFSKDEFPEVYVPTVFENYVADIEVDGKQVELALWDTAGQEDYDRLRPLSYPDTDVILMCFSVDSPDSLENIPEKWVPEVKHFCPNVPIILVANKKDLRSDEHVRTELARMKQEPVRTDDGRAMAVRIQAYDYLECSAKTKEGVREVFETATRAALQKRYGSQNGCINCCKVL +>XP_004865105.1_PREDICTED:_ras-related_protein_Rab-2B +MTYAYLFKYIIIGDTGVGKSCLLLQFTDKRFQPVHDLTIGVEFGARMVNIDGKQIKLQIWDTAGQESFRSITRSYYRGAAGALLVYDITRRETFNHLTSWLEDARQHSSSNMVIMLIGNKSDLESRRDVKREEGEAFAREHGLIFMETSAKTACNVEEAFINTAKEIYRKIQQGLFDVHNEANGIKIGPQQSISTSPGPGACQWNSRDVGSDSGCC +>XP_012934205.1_PREDICTED:_CCR4-NOT_transcription_complex_subunit_8_isoform_X1 +MPAALVENSQVICEVWASNLEEEMRKIREIVLSYSYIAMDTEFPGVVVRPIGEFRSSIDYQYQLLRCNVDLLKIIQLGLTFTNEKGEYPSGINTWQFNFKFNLTEDMYSQDSIDLLANSGLQFQKHEEEGIDTLHFAELLMTSGVVLCDNVKWLSFHSGYDFGYMVKLLTDSRLPEEEHDFFHILNLFFPSIYDVKYLMKSCKNLKGGLQEVADQLDLQRIGRQHQAGSDSLLTGMAFFRMKELFFEDSIDDAKYCGRLYGLGTGVAQKQNEDVDSAQEKMSILAIINNMQQ +>XP_004838717.1_PREDICTED:_inhibitor_of_nuclear_factor_kappa-B_kinase_subunit_alpha_isoform_X1 +MERPPGLRPGAGGPWEMRERLGTGGFGNVCLYQHRELDLKIAIKSCRLELSTKNRERWCHEIQIMKKLNHANVVKACDVPEELNFLINDVPLLAMEYCSGGDLRKLLNKPENCCGLKESQILSLLSDIGSGIRYLHENKIIHRDLKPENIVLQDVGGKAMHKIIDLGYAKDVDQGSLCTSFVGTLQYLAPELFENKPYTATVDYWSFGTMVFECIAGYRPFLHHLQPFTWHEKIKKKDPKCIFACEEMTGEVRFSSHLPQPNSLCSLIVEPMENWLQLMLNWDPQQRGGPVDLTLKQPRCFILMDHILNLKIVHILNMTSAKIISFLLPPDESLHSLQSRIEHETGINTGSQELLSETGISLDPRKPASQCVLDGVRGCDSYMVYLFDKSKTVYEGPFASRSLSDCVNYIVQDSKIQLPVVQLRKVWAEAVHYVSGLKEDYSRLFQGQRAAMLSLLRYNANLTKMKNTLISASQQLKAKLEFFQKSIQLDLERYSEQMTYGISSEKMLKAWKEMEEKAIHYAEVGVIGYLEDQIMSLHTEIMELQKSPYGRRQEDLMESLGQRAIDLYKQLKHRPADHSYSDSTEMVKIIVHTVQSQDRVLKELFGHLSKLLGCKQKIIDLLPKVEVALSNIKEADNTVMFMQGKRQKEIWHLLKIACTQSSARSLVGSSLEGAVTPQASAWLPPTLAEREHSLSCVVTPQDGESLAQVIEENLNCLGHLNTIIHEANEEQGNSMMNLDWSWLTE +>XP_004841553.1_PREDICTED:_insulin-like_peptide_INSL5 +MRGPVFTLFLFSVLFAVSEVRGTDTVKLCGLDYVRTVVYICATARWRRQAEGTLPGLQAERRSDLHREASQEILARNLAKLDFSGEELVQEEQVPTEGLRETKKHLAMSRRDLQTLCCTEGCSMTELSGLC +>XP_004873567.1_PREDICTED:_3-hydroxyacyl-CoA_dehydrogenase_type-2 +MAVACRSVKGLVAVITGGASGLGLGTAKRLVEQGAIAVLLDLPNSDGEAQAKKLGKSCVFAPVDVTSEKDVQTALTLAKENFGHVDVAVNCAGIAVANKTYNLKKQQPHSLEDFQRILNVNLLGTFNVIRLVAGEMSRNEPDQGGQRGVIINTASVAAFEGQVGQAAYSASKGGIVSMTLPIARDLAPMGIRVMTIAPGLFDTPLLTSLPEKVRNFLASQVPFPTRIGDPAEYAHLVQTIIENPFLNGEVIRLDGAIRMQP +>XP_004870555.1_PREDICTED:_DNA_repair_protein_complementing_XP-C_cells_isoform_X2 +MARKRAARGRKAGDSSVARRKEKEEADVFEDKKMKLPKKSFHSKVSRGERKRGFTDPGAPADGPVKKKVTKVTVKSEKLKAIKDEPLSDGEDFRDSSRGLKKAQHPKREAAVDKGSDERDEEESEDDWEEVEELSGPAPGDVGESSTSQSILSLKPVEIEIETPEQVKTRERSEKIKMEFETCLRRMMKRFSREVRENTHKVHLLCLLGNGFYRNGVCSQPDLLAVGLSIIPAHFTRVLPQDVDSGYLSSLLKWFIGTFTVNADLSAPDQSSLQTTLERRFAIYSARDEEELVHVFLLILRALQLLTRLVLSLQPLPLKSSMVKGKKPPQERATEDPGDAPGTSSQAAENQPKLQTSKGTREREAFPKGPGKAVTKGKRSKAAAGSAKQREPSSSESEEAGPGKQQPRHSRAQRRALRVSYKEESESDLAASSSDFEPSSGEAHHSSDEDSEPAPRRQRRAPAPQRMKAGSKSDSRTQPGSRRQHPASSRSPGSKRGKKVSQDDEEAGGGRGAGVDQWLEVFCEKEEKWVCVDCAHGLVGQPQACYRYATKPMTYVVGIDSNGWVRDVTQRYDPAWMTATRKCRVDAEWWDETLRPYRSPFMEREKKEDLEFQAKHLDQPLPSAISTYKNHPLYALKRHLLKYEAIYPETAAVLGYCRGEAVYSRDCVHTLHSRDTWLKQARVVRLGEVPYKMVKGYSNRARKARLADPQLRDQNDLGLFGHWQTEEYQPPVAVDGKNQWLCCLRGIQRCAPHCLGE +>XP_004850634.1_PREDICTED:_cannabinoid_receptor_2 +MEGCPETEAANSSMANLDFHPMKHYMVLSGPQRVAVAVLCTLLGLLSTLANAAALYLILSSHRLRQKPSYLFIGSLAGADLLASAIFVCSFVNFHVFSGVDSQVVFLLQICSVTMTFTASVGSLLLTAVDRYLCLRHPQTYRDLLTRGRALAALGVLWVLSALVSYPPLMGWSCCPSLCSELFPLISNDYLLGWLLFIAVLFSGIIYTYSHVLWKAHQHVASLAEHQDKQVPGMTRMRLDVRLAKTLGLLLAVLFVCWFPALALMVYSLAAKLSDKVKKVFAFFSILCLINSMVNPVIYALRSREIRSSARHRLAGWKKCLRGLGMEGKEEAPRSSMKSSITETEADMKITTGLASRDLFYLDS +>XP_012929367.1_PREDICTED:_B_box_and_SPRY_domain-containing_protein_isoform_X2 +MAAEGSGLQRELGPGPKPDALCPEHGQGLGWFCGSERRPVCAACVGPGGRCRGHRVRRAKEHAEELRNKIVDQCERLQLQSAGITKYVAEVLSGKNQRAVSTASAAREVVIQRLSLVRSLCESEEQRLLEQVHGEEERTHQSILTQRAHWAEALQKLNTIRSSLVDMLTHLDDHQLIKEQEIFERTEEAEGILDPQESEKLNFNEKCTWSPLLTQLWATAVLGSLSGTEDVRIDERTVSPFLQLSDDRRTLTFSAKKSKACADGPERFDHWPNALAAASFQTGLHAWMVNVQNSCAYKVGVASGQLPRKGSGSDCRLGHNTFSWVFSRYDQEFRFLHNGQHQPLGLLRSPAQLGVLLDLEARELLFYEPASGTVLYTYHTAFPTPLFPVFAVADQTISIIH +>XP_004841034.1_PREDICTED:_phosphatase_and_actin_regulator_3_isoform_X2 +MRGRGGGRARWPAPLRSLLRAFGARDPAAASRGSAQDEMDRMPPARSEYPVSGIRTPPVRRNSRLATLGRIFKPWKWRKKKNEKLKQTTSALEKKMASRQGREELIKQGLLEMMEQDAESKVCSPGGGLRPTQSEPSTPQPEALTSEDAQPGSPSATAGANQASLDEPLSSDAHSDNAAKLPSVSSGDEADAGSLLSAPDELSQALAGSDSLDSPARALERCVGQLPSAPLLPTPPPKASSKTTRNVTGQAALFQGSGVKSSDPGLRGQLSTPTGSPHLTTIHRPLPPSRVIEELHRALATKHRQDSFQGRESKGSPKKRVDIHLSRTSSMERGEETEEAWSFDGALESKRTAAKESEENKENLIMSSELKDDLLLYQDEEALNDSIISGTLPRRCKKELLAVKLRNRPSKQELEDRNIFPRRTDEERQEIRQQIELKLSKRLSQRPAVEELERRNILKQRNDQTEQEERREIKQRLTRKLNQRPTVDELRDRKILIRFSDYVEVAKAQDYDRRADKPWTRLSAADKAAIRKELNEYKSNEMEVHASSKHLTRFHRP +>XP_004873942.1_PREDICTED:_origin_recognition_complex_subunit_6_isoform_X2 +MSASLQRTARVSPSRAMGSGLIERLAPRLGLAEPSVLRKAEEYLRLSQVKCTALSAHSTETSNAVMCLDLAAACMKCPLDRAYLIKLSGLNKKMYQSCLKSLECLLDVNSNIGIKDLAVQFSCTEAVNMASKILQSYESSLPQTQQVDLDLSRPLFTTAALLSACKILKLKVDKNKMIAMAGVKKAIFDRLCKQLEKTGQHIDRELRDLPSPPRKKKNTVVESLAKEIKKVEEIPHKPQKDKDVTQDYEEWKRKILENAASAQKTTAE +>XP_012921127.1_PREDICTED:_olfactory_receptor_4K15-like +MNETNHSQVTEFVLLGLSSSKELQPFLFLIFSLLYLAILLGNFLIILTVNSDPRLHTPMYFLLANLSFIDVCVASFATPKMIADLLVEHKTISFEACLVQIFCVHLFAGGEMVMLVSMAYDRYVAICKPLHYMTIMNHRVCIILVIIPWCVGFIHTTSQLAFTVNLPFCGPNQVDSFFCDLPLVTKLACTDTYVISLLIVADSGFLSLSSFVLLVVSYTVILFTVRKRSSASMAKARSTLTAHITVVTLFFGPCIFIYVWPFSSYSVDKILAVFYTVFTPILNPVIYTLRNKEMKAAMSKLKSKLLKPGQVSVLIRNVLSLET +>XP_004842010.1_PREDICTED:_type_2_phosphatidylinositol_4,5-bisphosphate_4-phosphatase_isoform_X1 +MAADGVDERSPLLSAAHSGNVTPTAPPYLQESSPRAELPPPYTAIASPDASGIPVINCRVCQSLINLDGKLHQHVVKCTVCNEATPIKNPPTGKKYVRCPCNCLLICKDTSRRIGCPRPNCRRIINLGPVMLISEEQPAQPALPVQPEGTRVVCGHCGNTFLWMELRFNTLAKCPHCKKISSVGSALPRRRCCAYITIGMISIFIGVGLTVGTQDFARQFHATYISWAIAYFLGLICLIRACYWGAIRVSYPEHSFT +>XP_012924063.1_PREDICTED:_rho_guanine_nucleotide_exchange_factor_1_isoform_X1 +MEDIAPRAASGLPRPGLVPVSIIGAEDEDFENELEAHSEEQNSQFQSLEQVKRRPAHLMALLQHVALQFDPAPLLCCLHADMLCSLGPKEAKKTFVDFYHSFLDKTAVLRVPVPPSVAFELDRTRPDLLSEDIQRRFVQEVVQFQQATVGQQLEDFRSKRLMGMTLWEQELSQLEAWVGRDRASYEARERHVAERLLSHLEEMQHTISSDEDKSAAVVTAIGLYMRHLGVRTKSGDKKSGRNFFRKKVMGNRRSDEAPKTKKGLSSILDAARWNRGENQAPDFRHLKSEVDAEKPGPTDRKGGLGVSSRDRNTGTPGLDTPGVSLHPLSGDSPDREPGVDAPLELGDPPPQGPMSLEPLMPPESTEEGAETERKWKRLSGRLGRSESLRVSDRRRPSRGSLGAKGRGGGRSRSDVDMDPSSATAVLGPARRATPEPGDEGEPGRSGLELEPEEPPGWRELVPPDTLLSLPKSQVKRQEVISELLVTEAAHVRMLRVLHDLFYQPIAEGGFFVLEELQNIFPSLDELIEVHSLFLDRLMKRRQESGYLIEEIGDVLLARFDGAEGSWFQKISSRFCSRQSFALEQLKAKQRKDPRFCAFVQEAESRPRCRRLQLKDMIPTEMQRLTKYPLLLQSIGQNTEEPKEREKVEQAAECCRLILHHVNQAVRDTEDLLRLRDYQRRLDLSHLRQSNDPMLSEFKNLDITKKKLVHEGPLTWRVTKDKAVEVHVLLLDDLLLLLQRQDERLLLKSHSRTLTPTPDGKTMLRPVLRLTSAMTREVATDHKAFYVIFTWDQEAQIYELVAQTVSERKNWCALITETAGSLKVPAPASRPKPRPSPSSTRESLLSSSENGNGGREVPPADAQTERILSDLLPFCRPGPEGQLAATALRKVLSLKQLLLPTEEDSGVGPPRDGDGVPGGGPLGPAQTQEIQENLLSLEEAIKQLEELEEEFCRLRPLLAQLGGNPAPQPGCT +>XP_012926212.1_PREDICTED:_hepatocyte_nuclear_factor_3-beta_isoform_X3 +MNAGLGMNGMNTYMSMSAAAMGSGSGNMGAGSMNMSSYVGAGMSPSLAGMSPGAGPMAGMGGTAGAAGVAGMGPHLSPSLSPLGGQAAGAMGGLAPYANMNSMSPMYGQAGLSRARDPKTYRRSYTHAKPPYSYISLITMAIQQSPNKMLTLSEIYQWIMDLFPFYRQNQQRWQNSIRHSLSFNDCFLKVPRSPDKPGKGSFWTLHPDSGNMFENGCYLRRQKRFKCEKQLALKEAAGGGKKGAAGSSATQAPLGEPSGPAPETPAGTESPHSSASPCQEHKRGPLGELKVPPTAGLSPPEPAPSPGQQPSAAAHLLGPAHHPGLPPEAHLKPEHHYAFNHPFSINNLMSSEQQHHHSHHHHQPHKMDLKAYEQVMHYPGYGSPMPGSLAMGPVTNKAGLDASPLAADTSYYQGVYSRPIMNSS +>XP_012925804.1_PREDICTED:_voltage-dependent_calcium_channel_subunit_alpha-2/delta-1_isoform_X3 +METMGAGRLLAVVLALLQGALIRPSAPEPFPSAVTIKSWVDRMQEDLVTLAKTASGVTQLVDIYEKYQDLYTVEPNNARQLVEIAARDIEKLLSNRSKALERLALKAEKVQAAHQWREDFASNEVVYYNAKDDLDSEKNDSEPGSQRIKPVFVEDANFGRQISYQHAAVHIPTDIYEGSTIVLNELNWTSALDEVFKKNREEDPTLLWQVFGSATGLARYYPASPWVDSRTPNKIDLYDVRRRPWYIQGAASPKDMLILVDVSGSVSGLTLKLIRTSVSEMLETLSDDDFVNVASFNSNAQDVSCFQHLVQANVRNKKVLKDAVNNITAKGITDYKKGFSFAFEQLLNYNVSRANCNKIIMLFTDGGEERAQEIFTKYNKDKKVRVFTFSVGQHNYDRGPIQWMACENKGYYYEIPSIGAIRINTQEYLDVLGRPMVLAGEKARKVQWTNVYLDALELGLVITGTLPVFNRTGQSENETNLKNQLILGVMGVDVSLEDIKRLTPRFTLCPNGYYFAIDPNGYVLLHPNLQPKNPKSQEPVTLDFLDAELENDIKVEIRNKMIDGESGEKTFRTLVKSQDERYIDKGNRTYTWTPVNGTDYSLALVLPTYSFYYIKAKIEETITQARSKKGKMKDSETLKPDNFEESGYTFIAPRDYCNDLKPSDNNTEFLLNFNEFIDRKTPNNPSCNTDLINRVLLDAGFTNELVQNYWSKQKNIKGVRARFVVTDGGITRVYPKEAGENWQENPETYEDSFYKRSLDNDNYVFTAPYFNKSGPGAYESGIMVSKAVEIYIQGKFLKPAVVGIKIDVNSWIENFTKASIRDPCAGPICDCKRNSDVMDCVILDDGGFLLMANHDDYTNQIGRFFGEIDPSLMRHLVNIPVYAFNKSYDYQSVCEPGAAPKQGAGHRSAHVPSIADVLQIGWWATAAAWSILQQFLLSLTFPGLLEAVDVEEEDFTASLSKQSCITEQTQYFFYNDSKSFSGILDCGNCSRIFHVEKLMNTNLMFIMVESKGSCPCDTRLLIQAEQTSDGPNPCDMVKQPRYRKGPDVCFDNSEMEDYSDCGGVSGLRSSLWSVLGLQFLLLWLVSGSRHYLL +>XP_004840470.1_PREDICTED:_archaemetzincin-1 +MLPCRPAQEFSFGPRMLRDALVSSDTGLQQCYTGAFSLAERLFLAEAYNPHRTLFHPLLIYSAFDWLLSRPEAPEDFASFHAALPHRTQSLPRKHIYLQPIDLSEAPVGFPLLDYLRSCAEAFFLGLRVKCLPSVAAESISCSSRPRRDSDGLQLNTDGILSFLKNNKPDDALCVLGLTLSDLYPCEAWSFTFSTFLPGHKVGICSFARFVGELPQAGSSAPYPAPLEAAVDGSERLTQDSGQRLCFSALGVVQCCKVTCHELCHLLGLGNCRWLRCLMQGALSLEEVLRWPLDLCPICLRKLQHVLGFQLLDRYKRLHTWTQAVVGTWPSLEAGEPSVSETTLPVSADSGMCCESDSEPGTSLSEPGTPDAWSRTFPEGPEDELSSLAAAEVLPRLGGPVEAMEEHGRWLATCIEALEREVAEEELAQVDRAVDALEPWEMFTGRLPAIRQDRPCSRDSAGLRKVLGDKLSSLRRRLGMRRLSKVDSSPCHWDGQEK +>XP_004858457.1_PREDICTED:_E3_ubiquitin-protein_ligase_NEDD4-like_isoform_X1 +MATGLGEQVYGLSEDEGESRILRVKVVSGIDLAKKDIFGASDPYVKLSLYVADENRELALVQTKTIKKTLNPKWNEEFYFRVNPSNHRLLFEVFDENRLTRDDFLGQVDVPLSHLPTEDPTMERPYTFKDFLLRPRSHKSRVKGFLRLKMAYMPKNGGQDEESSEQRDDMEHGWEVVDSSDSASQHQEELPPPPLPPGWEEKVDNLGRTYYVNHNNRTTQWHRPSLMDVSSESDNNIRQINQEAAHRRFRSRRHISEDLEPEASEGGEGPEPWETISEEVNMTGDSLGLALPPPPASPVSRTSPQELSEELSRRLQITPDSNGEQFTSLIQREPSSRLRSCSVTDTVAEQGHLPPPSAPTGRARSSTVTGGEEPTPSVAYVHTTPGLPSGWEERKDAKGRTYYVNHNNRTTTWTRPIMQLAEDGASGSATNSNNHLIEPQIRRPRSLSSPTVTLSAPLEGAKDSPIRRAVKDTLSNPQSPQPSPYNSPKPQHKVTQSFLPPGWEMRIAPNGRPFFIDHNTKTTTWEDPRLKFPVHMRSKASLNPNDLGPLPPGWEERIHLDGRTFYIDHNSKITQWEDPRLQNPAITGPAVPYSREFKQKYDYFRKKLKKPADIPNRFEMKLHRNNIFEESYRRIMSVKRPDVLKARLWIEFESEKGLDYGGVAREWFFLLSKEMFNPYYGLFEYSATDNYTLQINPNSGLCNEDHLSYFTFIGRVAGLAVFHGKLLDGFFIRPFYKMMLGKQITLNDMESVDSEYYNSLKWILENDPTELDLMFCIDEENFGQTYQVDLKPNGSEIMVTNENKREYIDLVIQWRFVNRVQKQMNAFLEGFTELLPIDLIKIFDENELELLMCGLGDVDVNDWRQHSIYKNGYCPNHPVIQWFWKAVLLMDAEKRIRLLQFVTGTSRVPMNGFAELYGSNGPQLFTIEQWGSPEKLPRAHTCFNRLDLPPYETFEDLREKLLMAVENAQGFEGVD +>XP_012933589.1_PREDICTED:_beta-1,3-N-acetylglucosaminyltransferase_radical_fringe_isoform_X4 +MSCARGALCRACLALAAALAALLLLPLPRPPAPARLPAAVVVASPSLRPDDDIFIAVKTTRKNHGPRLGLLLRTWISRARPQTFIFTDGDDPELQRQAGSHIINTNCSAVRTRQALCCKMSVEYDKFIESGRKTLPAHRWFCHVDDDNYVNPTTLLHLLSTFSPNQDVYLGRPSLDHPIEATERVQGGGTATTVKFWFATGGAGFCLSRGLALKMSPWARQLHEHSGEGEASRRLHGGLHRGRAAGGPAAAQPPLPLPPGEPAEAADGRCAAAGHSKLWGS +>XP_004855755.1_PREDICTED:_tropomyosin_alpha-1_chain_isoform_X12 +MAGSSSLEAVRRKIRSLQEQADAAEERAGSLQRELDQERKLRETAEADVASLNRRIQLVEEELDRAQERLATALQKLEEAEKAADESERGMKVIESRAQKDEEKMEIQEIQLKEAKHIAEDADRKYEEVARKLVIIESDLERAEERAELSEGKCAELEEELKTVTNNLKSLEAQAEKYSQKEDKYEEEIKVLSDKLKEAETRAEFAERSVTKLEKSIDDLEDELYAQKLKYKAISEELDHALNDMTSM +>XP_004844462.1_PREDICTED:_type_I_inositol_3,4-bisphosphate_4-phosphatase_isoform_X3 +MTAREHSPRHGARARAMQRASTIDVAADMLGLSLAGNIQDPDEPILEFSLACSELHTPSLDRKPNSFVAVSVTTPPQAFWTKHAQTEIIEGTNNPIFLSSIAFFQDSLINQMTQIKLSVYDVKDRSQGTMYLLGSGTFIVKDLLQDRHHRLHLTLRSAESDRVGNITVIGWQMEDKSDQRPPVTRSLDPVNGRMVLPVDESLTEALGIRSKYASLRKDTLLKSVFGGAICRMYRFPTTDGNHLRILEQMAESVLSLHVPRQFVKLLLEEDAARVCELEELGELSPCWESLRRQIVTQYQTVILTYQENLTDLHQYKGPSFKASSLKADKKLEFVPTNLHIQRMRVQDDGGSDQNYDIVTIGAPAAHCQGFKSGGLRKKLHKFEETKKHSFEESCTSSSCQSIIYIPQDIVRAKEIIAQINTLKTQVSYYAERLSRAAKDRSATGLERTLAILADKTRQLVTVCDCKLLANSIHGLNAARPDYIASKASPTSTEEEQVMLRNDQDTLMARWTGRNSRSSLQVDWHEEEWEKVWLNVDKSLECIIQRVDKLLQKERLHGESCEDVFPYAGSCTSKKDCSPPPEAPSPGEWSEALYPLLTTLTDCVAMMSDKAKKAMVFLLMQDSAPTIASYLSLQYRRDVVFCQTLTALICGFIIKLRNCLHDDGFLRQLYTIGLLAQFESLLSTYGEELAMLEDMSLGIMDLRNVTFKVTQATSNASTDMLPVITGNRDGFNVRIPLPGPLFDALPREIQSGMLLRVQPVLFNVGINEQQTLAERFGDTSLQEVINVESLVRLNSYFEQFKEVLPEDCLPRSRSQTCLPELLRFLGQNVHARKNKNVDILWQAAEICRRLNGVRFTSCKSAKDRTAMSVTLEQCLILQHEHGMAPQVFTQALECMRSIGTREVVTQKNLSGLVPIRDLRLDPSLLCSIPLLALSPNLLIVWLFLSIAYLVTKLRCK +>XP_004843156.1_PREDICTED:_carbonic_anhydrase_7_isoform_X3 +MTGWGYGQDDGPSNWHKLYPIAQGDRQSPINIISSQAVYSPSLQPLELSYEACTSLSITNNGHSVQVDFNDSDDRTVVTGGPLEGPYRLKQFHFHWGKKRDVGSEHTVDGKSFPSELHLVHWNAKKYSTFGEAASAPDGLAVVGVFLETGDEHPSMNRLTDALYMVRFKMEKFRSLLFTSEDDERIHMVNNFRPPQPLKGRVVKASFRA +>XP_012926753.1_PREDICTED:_synaptojanin-1_isoform_X10 +MLHYLVLVTGCMSVGKIQESEVFRVTSTEFISLRVDASDEDRISEVRKVLNSGNFYFAWSASGASLDLSLNAHRSMQEHTTDNRFFWNQSLHLHFKHYGVNCDDWLLRLMCGGVEIRTIYAAHKQAKACLISRLSCERAGTRFNVRGTNDDGHVANFVETEQVVYLDDSVSSFIQIRGSVPLFWEQPGLQVGSHRVRMSRGFEANAPAFDRHFRTLKNLYGKQIIVNLLGSKEGEHMLSKAFQSHLKASEHAADIHMVNFDYHQMVKGGKAEKLHSVLKPQVQKFLDYGFFYFDGSEVQRCQSGTVRTNCLDCLDRTNSVQAFLGLEMLAKQLEALTLAEKPQLVTRFQEVFRSMWSVNGDSISKIYAGTGALEGKAKAGKLKDGARSVTRTIQNNFFDSSKQEAIDVLLLGNTLNSDLADKARALLTTGSLRVSEQTLQSASSKVLKSMCENFYKYSKPKKIRVCVGTWNVNGGKQFRSIAFKNQTLTDWLLDAPKLAGIQEFQDKRSKPTDIFAIGFEEMVELNAGNIVNASTTNQKLWAVELQKTVSRDNKYVLLASEQLVGVCLFVFIRPQHAPFIRDVAVDTVKTGMGGATGNKGAVAIRMLFHTTSLCFVCSHFAAGQSQVKERNEDFIEIARKLSFPMGRLLFSHDYVFWCGDFNYRIDLPNEEVKELIRQQNWDSLIAGDQLINQKNAGQIFRGFLEGKVTFAPTYKYDLFSDDYDTSEKCRTPAWTDRVLWRRRKWPFDRSAEDLDLLNASFQDESKILYTWTPGTLLHYGRAELKTSDHRPVVALIDIDIFEVEAEERQNIYKEVITVQGPPDGTVLVSIKSSLQEDNFFNDALIDELLQQFANFGEVTLIRFVEDKMWVTFLEGSSALSVLSLNGKELLNRTVTITLKSPDWIKNLEEEMSLEKISVTLPSSTSSTLLGEDAEVAADFDMEGDVDDYSAEVEELLPQHLQPSSSSGLGTSPSSSPRTSPCQSPTIAEAPVPCLPIRPSRAPSRTPGPPSSQSSPVDTQPAAQPQQKESSQTLEPKRPPPPRPGAPPTRPTPPQRPPPPSGARSPAPARKEFGGIGAPPSPGVARREMEAPKSPGTTRKENIGCNVFIPGRNQPSSQAGFGGPGPAGPSTARPTIPPRAGVISAPQSHARASAGRLTPESQSKPPEASKGSTLLPEPLKPQAAFPVQPSLPSPAPKFQEPLVPTAAPMPQLGPQPTLETPPQPPPRSRSSQGLPSESSPQPQVKTNGVSSVKQESLLKSDPFEDLSFNLLAVSKAQLSVQTSPVLTPDPERLIQLPPATQSTVNTWSSVSCMPTMPPIPARSQENTRSSPNPFITSLTSTNPFTDRTAVPGNPFRAQSQESEATSWLSKEEPITNSPVPSLMPLRQNSSKPSSSLDCFKDSFDLQGQSTVKTSNPKGWVTFEEEEDFGVKGKSKSFCPNALGNQPNAFDDDWNKGADVSLCVLPSRRPPPPPVPLLPPSASPATDPFTTLASKASPTQDFTER +>XP_012920744.1_PREDICTED:_leucine-rich_repeat-containing_protein_16B_isoform_X6 +MAKASVELTRELQDSIRRCLSQGAVFQQHRVKLETKPKKFEDRVLALTSWRLHLFPLKVPAKVESSFNVLEIRAFNTLGQNQILVETERGMVSLRLPSAESVDQVTRHVSSALSKVCPGPGCLIRRANADTPEGPRDTSPNSETSTSTTHSVCGGFSETYAALCDYNGLHCREEVQWDVDTIYHAEDNREFNLLDFSHLESRDLALMVAALAYNQWFTKLYCKDLRLGSEVLEQVLHTLSKSGSLEELVLDNAGLKTDFVQKLAGVFGENGSCVLHALTLSHNPIEDKGFLSLSQQLLCFPTGLTKLCLAKTAISPRGLQALGQTFGANPAFASSLRYLDLSKNPGLLATDEANALYSFLAQPNALIHLDLSGTDCTVDLLLGALLHGCCSHLTYLNLARNSCTHRKGREAPPAFKQFFSSTYTLSHINLSATRLPLEALRALLQGLSLNSHLSDLHLDLSSCELRSAGAQALQEQLGSVTCVGSLDLSDNGFDSDLLTLVPALGKNKSLKHLFLGKNFNVKAKTLEEILHKLVQLIQEEDCSLQSLSVADSRLKLRTSILINALGSNTCLAKVDLSGNGMEDIGAKMLSKALQINSSLRTILWDRNNTSALGFLDIARALESNHTLRFMSFPVSDISQAYRSAPERTEDVWQKIQWCLVRNNHSQTCPQEQAFRLQQGLVTSSAEQMLQRLCGRVQEEVRALRLCPLEPVQDELLYARDLIKDAKNSRALFPSLYELGHVLANDGPVRQRLESVASEVSKAVDKELQVILESMVSLTQELCPVAMRVAEGHNKMLSNVAERVTVPRNFIRGALLEQAGQDIQNKLDEVKLSVVTYLTNSIVDEILQELYHSHKSLARHLTQLRTLSDPQGGPGQGQDLSSRGRGRNHDHEETTDDELGTNIDTMAIKKQKRCRKIRPVSAFISGSPQDMESQLGSLGIPPGWFSGLGGSQPTASGSWEGLSELPTHGYKLRHQTQGRPRPPRTTPPGPGRPSQVPVPGTRQENGMASCLDEGLEDFFSRKVMDESSSYPRTLRTVRPGLSEPPLPPLQKKRRRGLFHFRRPRSFKGDRGPGSPTTGLLLPPPPPPPPTQESPPSPDPPSLGNNNSSPCWTPEEESSLLPGLAGGRGPSFRRKMGTEGSEAGEGVTTPRTAQQPTVHGVALPGLGRPKGWSFDGKREGTGSDLEDSTQAWQKRRSSDDAGPGAWKPPPPPQSSKPSFSAMRRAEATWHIAEESGPSHSCQSPSPASQDGEEEEGAFFPERTVLARNAKLQDPPLAPRLPKPVAVPRGRRAPQVQGGREEAETGGTAPGISKPRLRLGSQQDQEEPEVQGPPDPGRRTAPLKPKRTRRAQSCDKLEPDRRRPPDPAAGSSEPGTD +>XP_004838809.1_PREDICTED:_phospholysine_phosphohistidine_inorganic_pyrophosphate_phosphatase_isoform_X1 +MAVWGERLAGVRGVLLDISGVLFDSCEGGGVPIPGSVEAVARLKQSQLKVRFCTNESQKSRGKLVGLLQRLGFDISEGEVTSPAPAACQILKERGLRPHLLVHDDILSEFDKIDTSNPNCVLIADAGDAFSYKNMNKAFQVLMELENPVLISLGKGRYYKETLGLMLDVGAYMKALEYACGVEAEVVGKPSPEFFKNALQVLGVEAHQAIMIGDDIVGDVGGAQRCGMRALQVRTGKFRPSDEHHPEVKADGYVDNLAEAVDLLLQQVDK +>XP_012933189.1_PREDICTED:_calcium-binding_and_coiled-coil_domain-containing_protein_2_isoform_X2 +MKRKLKRASTSCFLSPSLGLEESQTSSLIRALDGPAMEKAREEPPSSTVLLDHASFSQVIFNNVEKFYLPGGDVTCFYIFTQQFTPRRKDWIGIFKVGWKTTREYYTFMWVALPRDPSTKQQEVQFRAYYLPKDDEYYQFCYVDQDGMVRGASVPFQFRPESEEDILVVTTKVKVEETEQHNKELCQENQELQALCAHLEEQNSAAQAELQRKQEELETLQSVNKKLEQESEEQKAHWDSERLQLKEQDQQLRSENDQLGTRVAELQSQLLSQEKEMEELVQGDQEKTEKLQHLKNGNDQLCLSLTEQREQQKKLEEALEEMRLRETAALKTQAALMDENLDLSRRLDDNKVLCDSLQREKELLERENDLLRKESCRLLSYQAPDFDSLPLQVPAWDQEGASQNPGLVFGNPYSGTQESSTPGPVRCTVPLSTSQVPKTFHPFSVCGLQGEDSGWKPMIRLGLTTSVSIGKCPVCSGVSPDGVCEHLEEQQRAQGHCMTCPVCDQTFPVTEKQIFEDHVFCHYLSAPLA +>XP_012922645.1_PREDICTED:_LOW_QUALITY_PROTEIN:_ret_finger_protein-like_4B +MPVTLATDVFEIVACECPLCECTVLLSSQPTPSKANLTRSHQGQGAGLQFHSRTVDGSVRPRFQSVLAAGAAVWGAFGALGQKAVSSILVRGSTPGPFDSFFTVFICNLSRSVVPSCYSLLPVSAAHIPFLTFGTVVASWQAQLTCPICLEVFSRVISLACSHIFLSFKCIENRIIEXDYTVIYLLCXGEVKLPVMEEWQNRSLDATSVTSLPMLSSNLKSVHVWIFSMKARAIHASXFPEIIPASPSFHCVGIFLGLDREEIKDFDVKNATLIYKQFFHSSV diff --git a/files/final_project/example/Proteins_1.fasta b/files/final_project/example/Proteins_1.fasta new file mode 100644 index 00000000..a6582e84 --- /dev/null +++ b/files/final_project/example/Proteins_1.fasta @@ -0,0 +1,200 @@ +>XP_004844552.1_PREDICTED:_UDP-glucuronic_acid_decarboxylase_1_isoform_X3 +MNFTQKYPPVKFLSEKDRKRILITGGAGFVGSHLTDKLMMDGHEVTVVDNFFTGRKRNVEHWIGHENFELINHDVVEPLYIEVDQIYHLASPASPPNYMYNPIKTLKTNTIGTLNMLGLAKRVGARLLLASTSEVYGDPEVHPQSEDYWGHVNPIGPRACYDEGKRVAETMCYAYMKQEGVEVRVARIFNTFGPRMHMNDGRVVSNFILQALQGEPLTVYGSGSQTRAFQYVSDLVNGLVALMNSNVSSPINLGNPEEHTILEFAQLIKTLVGSGSEIQFLSEAQDDPQKRKPDIKKAKLMLGWEPVVPLEEGLNKAIHYFRKELEYQANNQYIPKPKPARIKKGRMRRAR +>XP_004848039.1_PREDICTED:_heterogeneous_nuclear_ribonucleoprotein_D0_isoform_X1 +MSEEQFGGDGAAATAAVGGSAGEQEGTMAAAAQGAAAAAAGGGAGAGGGAAAGGPEGGSSESEGAKIDASKNEEDEGHSNSSPRHTEAATAQREEWKMFIGGLSWDTTKKDLKDYFSKFGEVVDCTLKLDPITGRSRGFGFVLFKESESVDKVMDQKEHKLNGKVIDPKRAKAMKTKEPVKKIFVGGLSPDTPEEKIREYFGGFGEVESIELPMDNKTNKRRGFCFITFKEEEPVKKIMEKKYHNVGLSKCEIKVAMSKEQYQQQQQWGSRGGFSGRARGRGGGPSQNWNQGYSNYWNQGYGNYGYNSQGYGGYGGYDYTGYNNYYGYGDYSNQQSGYGKVSRRGGHQNSYKPY +>XP_012933162.1_PREDICTED:_C-Jun-amino-terminal_kinase-interacting_protein_4_isoform_X11 +MIHNYMEHLERTKLHQLSGNDQLESTAHSRIRKERPITLGIFPLPAGDGLLTPDTQKGGETPGSEQWKFQDLSQPRSHTSLKVSSSPEPLKAIKQEDELSDVSQGGSKATTPASTANSDVAAIPPDTPLKEESDGLAKGTDSPAKLELSKHIEVQVAQETRNVSTGSAENEDKSEVQAIIESTPELDMDKDLSGFKGSSTPTKGIENKAFDRNTESLFEELSSAGSGLIGDVDEGADLLGEYSDHNFFGMGREVENLILENTQLLETKNALNVVKNDLIAKVDELTCEKDVLQGELEAVKQAKQKLEEKNRELEEELRKARAEAEDARQKAKDDDDSDIPTAQRKRFTRVEMARVLMERNQYKERLMELQEAVRWTEMIRASRENPAMQEKKRSSIWQFFSRLFSSSSSTTKKPEPPVNLKYNAPTSHVTPSVKKRSSTLSQLPGDKSKAFDFLSEETEASLASRREQKREQYRQVKAHVQKEDGRVQAFGWSLPQKYKQVTNGQGENKMKNLPVPVYLRPLDEKDASMKLWCAVGVNLSGGKTRDGGSVVGASVFYKDVAGLDMEGSKQRSASQSSLDKLDQELKEQQKELKTHEELSSQVWICTSTHSATKVIIIDAIQPGNILDSFTVCNSHVLCIASVPGARETDYPAGEELSESGQVDKASLCGSVTSNSSAETDSLLGGITVVGCSTEGATGAAASPSTNGASPVTDRPPEIEAENSEVDENVPTAEEATEATEGNAGSAEDAVDVSQPGVYTEHVFTDPLGVQIPEDLSPVCQSSSDSDVYKDPISSVLPNEQDLVREEAQKMSSLLPTMWLGAQNGCLYVHSSVAQWRKCLHSIKLKDSILSIVHVKGIVLVALADGTLAIFHRGVDGQWDLSNYHLLDLGRPHHSIRCMTVVHDKVWCGYRNKIYVVQPKAMKIEKSFDAHPRKESQVRQLAWVGDGVWVSIRLDSTLRLYHAHTYQHLQDVDIEPYVSKMLGTGKLGFSFVRITALMVSCNRLWVGTGNGVIISIPLTETVILHQGRLLGLRANKTSGAPGNRPGSVIRVYGDENSDKVTPGTFIPYCSMAHAQLCFHGHRDAVKFFVAVPGQVISPQSGSGSTDLTSDKAGPSAQEPGNQAPLKSMLVISGGEGYIDFRMGDEGGESELLGEDLPLEPSVTKAERSHLIVWQVMYGSE +>XP_012925689.1_PREDICTED:_histone_H3-4-like +MARTKQTARKSTGGKAPRKQLATKAARKSAPATGGVKKPHRYRPGTVALREIRRYQKSTELLILDSGIRPELRRQRPPRCGRCHGQITAATSAAEAAVAKAAPGASRFPDKQRCGPPPPSPTAGRVT +>XP_012929308.1_PREDICTED:_negative_elongation_factor_B_isoform_X2 +MFAGLQDLGVANGEDLKETLTNCTEPLKAIEQFQTENGVLLPSLQSALPFLDLHGTPRLEFHQSVFDELRDKLLERVSAIASEGKAEERYKKLEDLLEKSFSLVKMPSLQPVVMCVMKHLPKVPEKKLKLVMADKELYRACAVEVKRQIWQDNQALFGDEVSPLLKQYILEKENSLFSTELSVLHNFFSPSPKTRRQGEVVQKLTQMVGKNVKLYDMVLQFLRTLFLRTRNVHYCTLRAELLMSLHDLDVGDICTVDPCHKFTWCLDACIRERFVDSKRARELQGFLDGVKKGQEQVLGDLSMILCDPFAINTLSLSTIRHLQELVSQETLPRDSPDLLLLLRLLALGQGAWDLIDSQVFKEPKMEVELITKFLPMLMSFVVDDYTFNVDQKLPSEEKAPVTYPNTLPESFTKFLQEQRMACEVGLYYVLHITKQRNKNALLRLLPGLVETFGDLAFSDIFLHLLTGSLALLADEFALEDFCSSLFEGFFLTASPRVAPSKLEALQKALEPTGQTGEAVKELYTQLGEKLEQLDHRKPSPAQATETPTLELPLPSMPAPAGL +>XP_004837061.1_PREDICTED:_alpha-1-antichymotrypsin +MQLSAQGRVETMSLLLALGLLVAGFCPAIFCHPGGPAARETVPEDRDNGMHVDHLRLASSNADFAFSLYKQLALKAQNKNILFSPMSVSTALAFVSLGARNTTLTEILQGLKFNLTETPEAEIHRSFQHVLRTLQRPDDRLQLSIGNALFIHDQLKLLSKFTEDARGLYAAETITTNFQDPTAAERLINDFVKKETQGKISELVQDLGSTTMMVLVNYIFFKAKWKMPFDPRDTFESSFYLNKREEVQVPMMSLEGQHIPYFRDEELSCTVVELPYTGNASALLILPDKGKMRSVEAALLPESLRRWRDSLQPRRIDEFYLPKFSISGDYQLESILPELGIREVFSPEADLSGVTGAQDLQVSQIFHKAVLDVAEKGTEAAAATGIKFILTSGKIDPVILSFNRPFLMAILPTGMDNTLFLGKVTNPKQA +>XP_012923938.1_PREDICTED:_zinc_finger_protein_740_isoform_X1 +MAQASLLACEGLAGVSLVPTAASKKMMLSPITSKQAENGERAGSPDVLRCSSQGHRKESDKSRSRKDDDSLAEASHSKKTVKKVVVVEQNGSFQVKIPKNFICEHCFGAFRSSYHLKRHILIHTGEKPFECDICDMRFIQKYHLERHKRVHSGEKPYQCERCHQCFSRTDRLLRHKRMCQGCQSKTSDGQFSL +>XP_012928573.1_PREDICTED:_HAUS_augmin-like_complex_subunit_3 +MSCGNEFVETLKKIDYPKADTLNGEDFDWLFETVENESFLKWFCGNVSEQNVLSEKELEAFSILQKSGKPILEGVALDEVLKTCATSDLKTPRLDDKELEKLEDEVQMLQKLKNLKIQRRNKCQLMTSSSSHKSLRLSAEHEEATKNLKQSQGILTAMNTKLSNELQALTDRVTKLMMFFRHSDLSQEANPMVFLSQLSLEKYLSQEEQSTAALTLYTKKQFFQGIHEIVESSNEENFQLLDIRTSSLCDNQEILEERRLEMARLQLAYICAQHQLIHLKASNLSMKSSIKWAEENLHSLTSKAIGKENLDAKISDLNSEILKLEEQITHIKDKSLLAVVKENAQLLNMPVVKGDFDLQIAKQDHYTERQELVLNQLIKQKASFELVQLSYEIELRKHCDTYRQFEKLVQELSQNNMMLFQQLAMLKDPSVSQQINPRNTIDSKDYSSQRLYQLLEGENKRKELFMTHGNLEEMAEKLKQDVSLVQDQLTVSAQQHFLFLSKLNNDVDVLCDALYQGRNQLLLSDQDLTEQFHQVESQLNKLNHLLADTLADVKTKRKILTTNKLHQMERELYVHFFKNGNDLKDIVENLENQSKIKADGLKD +>XP_004854880.1_PREDICTED:_E3_ubiquitin-protein_ligase_RNF6 +MNQSGSRSGSGGEETSSQDHNHRENGRRWQQERLLREEAYYQFINELSDEDYRLMRDHNLLGTPGEITSEELQQRLDGVKEQLMSQPDLRNGTNNRGSQVPRESSNEDSLLAWLHTFHLTGNATRSGQTGNQTWRAVNRTNPNSGEFRFSLEIDINNENRGFEIREEDDTGISLSGINRGHTINRQQRSTSPVARRTRSQTSVNFSGDNSNIPRARLSSRRQNSVDRSLSTLRRLRNRTGRAVGIPRTSTSSNNFSSQTSQSGGSELRQREGQRFGAAHIWENGARTNVTVRNTNQRLEPIRLRSTFSSRSRSPIQRQSGTVHNSQRESRPSWQTIRRSARRRGITQVFLEPDREHRGTAYSRFSNSRLVSRITEEGEESNTSSLAAQRHPTITLDLQVRRIRPGEDRDQDSIANRTRSRTGQGENTITVESNSGGFHRTISRLERSGIRTYVSAVTVPLQRISENELVEPSSVALRSMFRQVMTGFGELSSLMEAESESEIQRNGQHLPDLSNLGTVDDSGQHSESSSQHRRAQEDSTEMLGENEITQPQNRSSDSRSSPQMQNSNNFVETRTLPIFRLAHFFLLNESEDDQRCGLTKEQIDNLSTRNYEHSGIDSELGKICSVCISDYVTGNKLRQLPCMHEFHIHCIDRWLSENCTCPICRQPVLGSGLANNG +>XP_004844000.1_PREDICTED:_protein_strawberry_notch_homolog_1_isoform_X1 +MVEPGQDLLLAALSESGISPNDLFDIDGDVGLATPTPTPALQQSVPFGALELGLEAEAAVTVKQETETVPTPALLNVRQQPPSTTTFVLNQINQLPTLGSTIVMTKTPPVTTNRQTITLTKFIQTTANTRPSVSAPAVRNTVTTAPSKDQVQLKDLLKNNSLNELMKLKPPANIVQPVATAATDVSNGTVKKESSNKEVARIWINDMKMRSFSPTMKVPVVKEEDEPEEEDEEEMGHAETYAEYMPIKLKIGLRHPDAVVETSSLSSVTPPDVWYKTSISEETIDSGWLSALQLEAITYAAQQHETFLPNGDRAGFLIGDGAGVGKGRTIAGIIYENYLLSRKRALWFSVSNDLKYDAERDLRDIGAKNILVHSLNKFKYGKISSKHNGSVKKGVIFATYSSLIGESQSGGKYKTRLKQLLHWCGDDFDGVIVFDECHKAKNLCPVGSSKPTKTGLAVLELQNKLPKARVVYASATGASEPRNMAYMNRLGIWGEGTPFREFSDFIQAVERRGVGAMEIVAMDMKLRGMYIARQLSFTGVTFKIEEVLLSQNYVKMYNKAVKLWVIARERFQQAADLIDAEQRMKKSMWGQFWSAHQRFFKYLCIASKVKRVVQLAREEIKNGKCVVIGLQSTGEARTLEALEEGGGELNDFVSTAKGVLQSLIEKHFPAPDRKKLYSLLGIDLTAPSNNSSPRDSPSKENKMKKRKGEEITREAKKARKVGGLAGSSSDDSGSESDASDIEESDYESSKNMSSGDDDDFNPFRDESSEGDEDDPWLIRKDHKKNKDKRKKKSIDPDSIQSALLASGLGSKRPSFSSTPVISPAPNSAPANSNASSNSSLITSQDAVERAQQMKKDLLEKLEKLAEDLPPNTLDELIDELGGPENVAEMTGRKGRVVSNDDGSISYESRSELDVPVEILNITEKQRFMDGDKNIAIISEAASSGISLQADRRAKNQRRRVHMTLELPWSADRAIQQFGRTHRSNQVTAPEYVFLISELAGEQRFASIVAKRLESLGALTHGDRRATESRDLSRFNFDNKYGRNALEIVMKSIVNLDSPMVSPPPDYPGEFFKDVRQGLIGVGLINVEDRSGILTLDKDYNNIGKFLNRILGMEVHQQNALFQYFADTLTAVVQNAKKNGRYDMGILDLGSGDEKVRKSDVKKFLTPGYSTSGHVELYTISVERGMSWEEATKIWAELTGPDDGFYLSLQIRNNKKTAILVKEVNPKKKLFLVYRPNTGKQLKLEIYADLKKKYKKVVSDDAFVHWLDQYNSSADTCTHAYWRGNCKKASLGLVCEIGLRCRTYYVLCGSVLSVWTKVEGVLASVSGTNVKMQIVRLRTEDGQRIVGLIIPANCVSPLVNLLSTSDQSQQLAVQQKQLWQQHHPQSIANLSNA +>XP_012922623.1_PREDICTED:_transmembrane_protein_14A +MDLIGFGYAALVTFGSILRYKRGGGVPSLIAGLFVGFLAAYGAYRVSSDKRDVKLSLFTAFFLATIMGVRFKRSKKIMPAGLVAGLSLLMILRLVLLLL +>XP_012920745.1_PREDICTED:_leucine-rich_repeat-containing_protein_16B_isoform_X7 +MAKASVELTRELQDSIRRCLSQGAVFQQHRVKLETKPKKFEDRVLALTSWRLHLFPLKVPAKVESSFNVLEIRAFNTLGQNQILVETERGMVSLRLPSAESVDQVTRHVSSALSKVCPGPGCLIRRANADTPEGPRDTSPNSETSTSTTHSVCGGFSETYAALCDYNGLHCREEVQWDVDTIYHAEDNREFNLLDFSHLESRDLALMVAALAYNQWFTKLYCKDLRLGSEVLEQVLHTLSKSGSLEELVLDNAGLKTDFVQKLAGVFGENGSCVLHALTLSHNPIEDKGFLSLSQQLLCFPTGLTKLCLAKTAISPRGLQALGQTFGANPAFASSLRYLDLSKNPGLLATDEANALYSFLAQPNALIHLDLSGTDCTVDLLLGALLHGCCSHLTYLNLARNSCTHRKGREAPPAFKQFFSSTYTLSHINLSATRLPLEALRALLQGLSLNSHLSDLHLDLSSCELRSAGAQALQEQLGSVTCVGSLDLSDNGFDSDLLTLVPALGKNKSLKHLFLGKNFNVKAKTLEEILHKLVQLIQEEDCSLQSLSVADSRLKLRTSILINALGSNTCLAKVDLSGNGMEDIGAKMLSKALQINSSLRTILWDRNNTSALGFLDIARALESNHTLRFMSFPVSDISQAYRSAPERTEDVWQKIQWCLVRNNHSQTCPQEQAFRLQQGLVTSSAEQMLQRLCGRVQEEVRALRLCPLEPVQDELLYARDLIKDAKNSRALFPSLYELGHVLANDGPVRQRLESVASEVSKAVDKELQVILESMVSLTQELCPVAMRVAEGHNKMLSNVAERVTVPRNFIRGALLEQAGQDIQNKLDEVKLSVVTYLTNSIVDEILQELYHSHKSLARHLTQLRTLSDPQGGPGQGQDLSSRGRGRNHDHEETTDDELGTNIDTMAIKKQKRCRKIRPVSAFISGSPQDMESQLGSLGIPPGWFSGLGGSQPTASGSWEGLSELPTHGYKLRHQTQGRPRPPRTTPPGPGRPSQVPVPGTRQENGMASCLDEGLEDFFSRKVMDESSSYPRTLRTVRPGLSEPPLPPLQKKRRRGLFHFRRPRSFKGDRGPGSPTTGLLLPPPPPPPPTQESPPSPDPPSLGNNNSSPCWTPEEESSLLPGLAGGRGPSFRRKMGTEGSEAGEGVTTPRTAQQPTVHGVALPGLGRPKGWSFDGKREGTGSDLEDSTQAWQKRRSSDDAGPGAWKPPPPPQSSKPSFSAMRRAEATWHIAEESGPSHSCQSPSPASQDGEEEEGAFFPERTVLARNAKLQDPPLAPRLPKPVAVPRGRRAPQVQGGREEAETGGTAPGISKPRLRLGSQQDQEEPEVQGPPDPGRRTAPLKPKRTRRAQSCDKLEPDRRRPPDPAGSSEPGTD +>XP_012930225.1_PREDICTED:_neurexin-2-beta_isoform_X17 +MFLFTTEWPEKKRFARGGPKAPGQELAVGREEHPMEGPAHLTLNSEVGSLLFSEGGAGRGGASDVHQPTKGKEEFVATFKGNEFFCYDLSHNPIQSSTDEITLAFRTLQRNGLMLHTGKSADYVNLSLKSGAVWLVINLGSGAFEALVEPVNGKFNDNAWHDVRVTRNLRQHAGIGHAMVNKLHYLVTISVDGILTTTGYTQEDYTMLGSDDFFYIGGSPNTADLPGSPVSNNFMGCLKDVVYKNNDFKLELSRLAKEGDPKMKLQGDLSFHCEDVAALDPVTFESPEAFVALPRWSAKRTGSISLDFRTTEPNGLLLFSQGQRPGAGPGSHGSAQRADYFAMELLDGYLYLLLDMGSGGIKLRASSRKVNDGEWCHVDFQRDGRKGSISVNSRSTPFLATGESEILDLESELYLGGLPEGGRVDLPLPPEVWTAALRAGYVGCVRDLFIDGRSRDLRGLAEAQGAVGVAPFCSRETLKQCASAPCHNGGICREGWNRFVCDCIGTGFLGRVCEREATVLSYDGSMYMKIMLPNAMHTEAEDVSLRFMSQRAYGLMMATTSRESADTLRLELDGGQMKLTVNLDCLRVGCAPSAAGKGPETLFAGHKLNDNEWHTVRVVRRGKSLQLSVDNVTVEAGQMAGAHTRLEFHNIETGIMTERRFISVVPSNFIGHLSGLVFNGQPYMDQCKDGDITYCELNARFGLRAIVADPVTFKSRSSYLALATLQAYASMHLFFQFKTTAPDGLLLFNSGNGNDFIVIELVKGYIHYVFDLGNGPSLMKGNSDKPVNDNQWHNVVVSRDPGNVHTLKIDSRTVTQHSNGARNLDLKGELYIGGLSKNMFSNLPKLVASRDGFQGCLASVDLNGRLPDLIADALHRIGQVERGCDGPSTTCTEESCANQGVCLQQWDGFTCDCTMTSYGGPVCNDPGTTYIFGKGGALITYTWPPNDRPSTRMDRLAVGFSTHQRSAVLVRVDSASGLGDYLQLHIDQGTVGVIFNVGTDDITIDEPNAIVSDGKYHVVRFTRSGGNATLQVDSWPVNERYPAGNFDNERLAIARQRIPYRLGRVVDEWLLDKGRQLTIFNSQAAIKIGGRDQGRPFQGQVSGLYYNGLKVLALAAESDPNVRTEGHLRLVGEGPSVLLSAETTATTLLADMATTIMETTTTMATTTTRRGRSPTLRDSTTQNTDDLLVASAECPSDDEDLEECEPSTGGELILPIITEDSLDPPPVATRSPFVPPPPTFYPFLPGVGATQDTLPPPAARRPPPGGPCQAEHDDSDCEEPIEASGFASGEVFDSSLPPTDDEDFYTTFPLVTDRTTLLSPRKPAPRPNLRTDGATGAPGVLLAPSVPAPNLPAGKMNHRDPLQPLLENPPPGPGAPTSFEPRRPPPLRPGVTSAPGFPPLPTANPTGPGERGPPGAVEVIRESSSTTGMVVGIVAAAALCILILLYAMYKYRNRDEGSYQVDQSRNYISNSAQSNGAVVKEKAPAAPKTPSKTKKNKDKEYYV +>XP_012925914.1_PREDICTED:_sulfatase-modifying_factor_2_isoform_X1 +MALSLSPPLPVLCLLSTPWLQLGNAQAADMVWLPGGRFLMGTDAPDARDGEGPVREVTVKPFGIDIFPVTNKDFRKFVREKKYRTEAELFGWSFVFEEFVSSELKNKAAQQMKPVLWWLPVERAFWRQPTGPGSGIRDRLEQPVLHVSWNDAQAYCRWRGRRLPTEEEWEFAARGGLKGQVYPWGNRFQPNRTNLWQGKFPKGDKAEDGFHGVSPVNAFPPQNDYGWEILLIQPRTIWASAVRPARAGPSVSCELGVEPLGTLSFPGHPQHTRILPSLPHYLPPGQEGTLGGVPGVGWRIGWRTGPQGGLGAGRFPLEVKCC +>XP_004847781.1_PREDICTED:_desmoplakin_isoform_X3 +MSCNGGSHPRLNTLGRMTRAESGPDLRDMRFETTSGGGGGTSRTYYSRRCVVNDQNSDGYGQTGTMSRMQNQNTIQELLQNCADCLMRAELIVQPELKYGDGIQLARSRELDECFAQANDQMEVTDSLIREMRHMGQPCDVYQKRLLQLQEQMRALYKAISVPRVRRASSKGGGGYTCQSGSGWDEFTKRLTSECLGWMRQQRAEMDMVAWGVDLASVEQHINSHRSLHNAIGDYRWQLDKIKADLREKSAIYQLEEEYENLLKTSFERMDHLRQLQNIIQATSREIMWINDCEEEELLYDWSDKNTNIAQKQEAFSIRMSQLEVKEKELNKLKQESDQLVLSQHPASDKIEAYMDTLQTQWSWILQITKCIDVHLKENAAYFQFFEEAQSTEAYLKGLQDSIRKKYPCDKNMPLQHLLEQIKELEKEREKILEYKRQVQNLVNKSKKIIQLKPRNPDYRSNKPIILRALCDYKQDQKIVHKGDECILKDNNERSKWYVTGPGGVDMLVPSVGLIIPPPNPLAVDLSCKIEQYYEAILALWNQLYINMKSLVSWHYCMIDIEKIRAMTIAKLKTMRQEDYMKTISDLELHYQEFIRNSQGSEMFGDDDKRKMQSQFTDAQKHYQTLVIQLPGHPQHQTVTKTEITHVGSCQDVNPNKMIETNRENDKQETWLLMELQKVRRQIEHCEGRMTLKNLLLTDQPSTHHITVKINELKSVQNDSQALAEVLNQLKDVLANFRGSEKYCYLQNEVFGLFQKLENINGVTDGYLNSLFTVRALLQAILQTEDMLKVYEARLTEEETVCLDLDKVEAYRCGLKKIKNDLNLKKSLLATMKAELQKAQQIHCQTSQQYPLYDLDLGKFNDKVIQLTDRWQKIDKQIDYRLWDLEKQIKQLRNYRDNYQNFCKWLYDAKRRQDSLESMKFGDSNTVMRFLNEQKNLHNEISGKRDKSEEVQKIAELCANSIKDYELQLASYTSGLETLLNIPIKRTMVQSPSGVILQEAADMHARYIELLTRSGDYYRFLSEMLKSLEDLKLKNTKIEVLEEELRLARDANSENCNKNKFLDQNLQKYQAECSQFKAKLSSLEELKRQAELDGKSAKQNLDKCYAQIKELNEKITRLTYEIEDEKRRRKSVEDRFDQQKSDYDQLQKARQSEKESLGWQKLESEKAVKEKEYEIERLKVLLQEEGARKREYENELAKASNRIHESKSQCTQVVQERESLLVKIRVLEQEKVRLQRLEEELNRLKATLEAEGRVKQRLESEKQQIQNDLNQWKTQYSRKEEAMRKIESDREKSEREKNTLRSEIERLQAEIKRIEERCRQKLEDSSRETQSQLETERSRLQREFDKLKQRPYGSHRETQTEYEWTVDSSKLVFDGLRKKVTAMQLYECQLIDKTTLDKLLKGKKSVEEVASEIQPFLRGAGAIAGASASPKEKYSLVEAKRKKLISPESTVMLLEAQAATGGVIDPHRNEKLTVDNAIARDLIDFDDRQQIYMAEKAITGFDDPFSGKTVSVSEAIKKNLIDRETGMRLLEAQLASGGIVDPVNSVFLPKDVALARGLIDRDLYRSLNDPRDSQKNFVDPFTKKKVSYVQLRERCRIEPHTGLLLLSVQKRSMSFQGIRQPVTVTELVDSGILRPSTVNELESGQISYDEVGERIKDFLQGSSCIAGIYNETTKQKLGIYEAMKIGLVRPGTALELLEAQAATGFIVDPVSNLRLPVEEAYKRGLVGIEFKEKLLSAERAVTGYNDPETGNIISLFQAMNKELIEKGHGIRLLEAQIATGGIIDPKESHRLPVNIAYKRGYFNEELSEILTDPSDDTKGFFDPNTEENLTYLQLKERCIKDEETGLCLLPLKEKKKQVQTSQKNTLRKRRVVIVDPETNKEMSVQEAYKKGLIDYETFKELCEQECEWEEITITGSDGSTRVVLVDRKTGSQYDIQDAIDKGLVDKKFFDQYRSGSLSLTQFADMISLKNGVGSSISMGSGVSDDVFSSSRHESVSKISTISSVRNLTIRSSSLSDPLEESSPIAAIFDTENLEKISVSEAIDRGIVDSITGQRLLEAQACTGGIIHPTTGQKLSLQDAMAQGLIDSDMATRLKPAQKAFIGFEGVKGKKKMSAAEAVKEKWLPYEAGQRFLEFQFLTGGLVDPEVHGRISTEEAIRKGFIDGRAAQRLQDTSSYAKILTCPKTKLKISYKDAMNRSMVEDITGLRLLEAASVSSKGLPSPYNMSSAPGSRSGSRSGSRSGSRSGSRSGSRSGSRRGSFDATGNSSYSYSYSFSSSSIGH +>XP_012933823.1_PREDICTED:_protein_disulfide-isomerase_A3 +MRSHRLELFSVVALLLSTARLAAASDVLELTDDTFESRVSDTGSAGLMLVEFFAPWLGSGRACVAARPQPSWPACSRPQEPEVSRPSGARSEMEPEGSAQGRIIAVDCTANTNTCNKYGVTGYPTLKIFRDGEEAGAYDGPRTADGIVSHLKKQSGPASVPLRTEEEFKKFISDKDASVVGFFRDLFSEAHSEFLKAASNFRDSYRFAHTNVESLVKEYDDNGEGITLFRPSHLANKFEDKTVAYTEQKMTSGKIKKFIQENIFGICPHMTEDNKDLIQGKDLLIAYYDVDYEKNTKGSNYWRNRVMMVAKKFLDAGHKLNFAVASRKTFSHELSDFGLESSTGEIPVVAIRTAKGEKFVMQEEFSRDGKALERFLQDYFDGNLKRYLKSEPIPESNDGPVKVVVAENFDEIVNNENKDVLIEFYAPWCGHCKNLEPKYKELGEKLSKDPNIVIAKMDATANDVPSPYEVRGFPTIYFSPANQKQSPKKYEGGRELSDFISYLQREATNPPIIQEEKPKKKKKAQEDL +>NP_001292035.1_putative_E3_ubiquitin-protein_ligase_SH3RF2 +MDDLTLLDLLECPVCFEKLDVTARVLPCQHTFCKPCLQKIFKAHKELRCPECRTLVFCSIEALPANLLLVRLLESMRSGQRSWRGGSFRRPGMLTSKNSRKSRTSPRSLQANPFRLVPNIRIHMDGVPRAKALCNYRGQNPGDLRFNKGDVILLRRQLDKNWYLGEINGVNGIFPASSVEVIKQLPQPPPLCRALYNFDLRNKDKNDNQDCLTFLKDDIITVISRVDENWAEGKLGDKVGIFPILFVEPNLTARHLLEKNKGHQSFRTKSLSLVSSSPRGETTNTPTLCRGPGSRRKGPGQFSITTALNTLNRMVHSPSGHHMVEISTPVLINSSNPSVITQPMEKADLPTSSAGQVSIYHPAPASPGHSMAMVSLPSSQQHLSANMFVALHSYSAHGPNELDLQKGEGIRVLGKYQDGWLRGISLVTGRVGIFPNNYVIPIFRKASSFPDSQSPGLYTTWTLSTSSASSQGSVSEGDPRQSRPFKSVFVPTAIINPVKSTAGSGALGQGSLRKGRNSMRKNGSLQRPAQSGIPTLVMGSLRRSPTMTARPQQFQFYQPQGVSSSSSSAVVEMGPKPPSTGEPALTFVNRGSETRIHSAASSLLMESKEVPTKSEPPPKPPASAPPSILVKPENSRNGIEKQVKTVRFQNYSPPPTKHHTSHSSSGKPEQSATLKGSQPEAASLSPEMTILFAHRSGCHSGQQTDLRRKSAFGKATTPVSTASAMKTMSPSK +>XP_012923089.1_PREDICTED:_platelet_endothelial_cell_adhesion_molecule_isoform_X1 +MRPVWAQRGMMWLGALLTLLLCSSLESQENSFTINTIHMQSLPDWTVQNGQNLTLQCIVDISTTSHIKPQYQVVFYKDDVLLYNVSSVKNTENFLIPQARVHDSGTYKCTVILNNKKKKTTPEYQLWVKGVPRPRMTLDKKEAIEGGVVTVNCSVPEERAPIHFKVEKFEQDPKIFKLKKEKTSWEQNFVTLEFPIREQDYVLYFTCQASISLGFQIETSETTRSEEMVTVTASFSTPKFQISPPGVITEGDQLHIRCTIQVTHLAHETPEILIQKDKAIVAHSRHSREAVYSVMATVEDNGNYTCKVESSRLSKVSSIVVNITELFPKPMLEFSSTRVDQGEKLDLLCSIPGAPPANFTIEKEGMIVSQGQNFTKITDGRDSGTYGCTAGIGKVVKRSNAVQITVCENISEPRIFHDTKSEIIKGQSIRVSCQSINGTSPITYHLLKGSDVLENITKTSNDPAVFQDNPTKDVEYKCIADNCHSYPEVSSEVLSIKVIAPVYQVKLTILRSAEVESGKEIVLQCSVNEGTGPITYKFYKDKESKPFHQAISNDTHVIWHKTQASKEQEGQYYCMASNKASVTQSSTQSNMLMVKVFLAPWKKGLIAVVIIGVIIATLIVGAKCYVMRKAKAKQMPVEMSRPAAPLLKSNNEKVSEPNIEANSHYGYSDEVGNHAMKPLNESKDSTNSDVEYTEVEVSSVEPHQVLGTKGTDTVYSEIRKADPNFVENRYSRTEVSLDRT +>XP_004836251.1_PREDICTED:_kelch-like_protein_3_isoform_X1 +MRNWPDSLQSRHRRQEPLGWASCPGLECLGRCIGSWKGGTILGALKLPLFLGDGGAGACGGGGASGLLLLAAERAAGSSGIKPSSQPLIQAGDDEKNQRTITVNPAHMGKAFKVMNELRSKQLLCDVMIVAEDVEIEAHRVVLAACSPYFCAMFTGDMSESKAKKIEIKDVDGQTLSKLIDYIYTAEIEVTEENVQVLLPAASLLQLMDVRQNCCDFLQSQLHPTNCLGIRAFADVHTCTDLLQQANAYAEQHFPEVMLGEEFLSLSLDQVCSLISSDKLTVSSEEKVFEAVISWINYEKETRLEHMAKLMEHVRLPLLPRDYLVQTVEEEALIKNNNTCKDFLIEAMKYHLLPLDQRLLIKNPRTKPRTPVSLPKVMIVVGGQAPKAIRSVECYDFEEDRWDQIAELPSRRCRAGVVFMAGHVYAVGGFNGSLRVRTVDVYDGVKDQWTSIASMQERRSTLGAAVLNDLLYAVGGFDGSTGLASVEAYSYKTNEWFFVAPMNTRRSSVGVGVVEGKLYAVGGYDGASRQCLSTVEQYNPATNEWTYVADMSTRRSGAGVGVLSGQLYATGGHDGPLVRKSVEVYDPGTNTWKQVADMNMCRRNAGVCAVNGLLYVVGGDDGSCNLASVEYYNPVTDKWTLLPTNMSTGRSYAGVAVIHKSL +>XP_012922384.1_PREDICTED:_leucine-rich_repeat_flightless-interacting_protein_1_isoform_X9 +MGSQGAGRRRLPQRERLTAEDDALSRIAREAEARLAAKRAARAEAREIRMKELERQQKEIYQVQKKYYGLDTKWGDIEQWMEDSERYSHRSRRLTSASDEDERLSVGSRGSLRSQPEQQYRGPCVWTNGYDGDLYGSQPPNRRSGRVEERPEKDFTEKGSRSMPGLSAATLASLGGSSSRRGSGDTSISIDTEASLREIKELNELKDQIQDVEGKYMQGLKEMKDSLTEVEEKYKKAMVSNAQLDNEKTNFLYQVDTLKDMLLELEEELAEARRQYEEKTKDFEREKHAHRALQFQFAEVKEALRQRDEMLEEIRQLQQKQASYIGEISDLQETIEWKDKKIGALERQKEFFDSIRSERDDLREEIVKLKEEFKKHGITLNSEVATNGETSGTLNNVGHPGPTKLTKEEVNALQPSGDGTLGRTKEVEVNNEIVQNVGTREISQNTEREQHKEDTVKDDEDVEGSRPGENTEGQKPCEDLAYAECEEQIQSQSPESHETPEQVGSQEVPDMPAEGSGASRGHPKYPEDLGSEAPGPMHEQDTCNASDVIGQSENSVGSQDQENQDLKTDMAELHRKPCQGPALGHGPEAERVSGADPGGPGGGRTEKEPANQEAAEPGGAAPHSAEGAREGSVEEEGDAGTGADKPARAEPQPVPGAPTADSSQEEAPGPGREHTGPEPNERKRDRQAEASESSQKKPKNKKKKTKKKKSPVPAESLEDVGKELAYKDADRGEVEGGQGHLAAEAQEEVAEGGTQRIAAGSGEQGDCAESGEDGNEDDCAKTEGGTEGAAGDTVDLAGRTFQPPGTEAIERELGEGDTDGGTETTGVGVAAEPESPDGTSSSSLQNESLSVAMEDPCRTGSPERHLTALEATGSVGLEEGEPGDLGSETGGHAGGGSGQSKGKEDCTMS +>XP_004854439.1_PREDICTED:_actin-binding_LIM_protein_3_isoform_X3 +MNTSIPYQQNPYSPRGSSNVIQCYRCGDTCKGEVVRVHNNHFHIRCFTCQVCGCGLAQSGFFFKNQEYICTQDYQQLYGTRCDSCRDFITGEVISALGRTYHPKCFVCSLCRKPFPIGDKVTFSGKECVCQTCSQSMTSTKPIKIRGPSHCAGCKEEIKHGQSLLALDKQWHVSCFKCQTCSVILTGEYISKDGVPYCESDYHSQFGIKCETCDRYISGRVLEAGGKHYHPTCARCVRCHQMFTEGEEMYLTGSEVWHPICKQAARAEKKLKHRRTSETSISPPGSSIGSPNRVICAKVDNEILNYKDLAALPKVKSIYEVQRPDLISYEPHSRYTSDEMLERCSYGESLGTLSPYSQDIYENLDLRQRRASSPGYIDSPTYSRQGMSPTFSRSPHHYYRSAGESNIYRKPPIYKRHGDLSTATKSKTSEDISQASKYSPAYSPDPYYAAESEYWTYHGSPKAPRARRFSSGGEEDDFDRSMHKLQSGIGRLILKEEMKARSSSYADPWTPPRSSTSSREALHTAGYDMSLNGSPRSHYLADSDPLISKSASLPAYRRNGLHRTPSADLFHYDSMNAVNWGMREYKIYPYELLLVTTRGRNRLPKDVDRTRLERHLSQEEFYQVFGMTISEFERLALWKRNELKKQARLF +>XP_004842843.1_PREDICTED:_estradiol_17-beta-dehydrogenase_2_isoform_X1 +MIMVISEAAWFCLAVTAALGSIVFCKHKSPGQLGRPVVWLTGLCGGAYLLILSFFWSLVLFSLLCFLMCMYLADQELLPVDQKAVLVTGCDSGFGHALAKNLDKLGFTVFAGVLNEKSSGAEELRRNCSKHITVLQMDITNPEQIKDAHSKVIEKVQDKGLWALVNNAGILGFPTDGELIPMIEYKKCMEVNFFGPVEVTKAFLPLLRKSKGRLVNVSSMGGVVPLPKFAAYNSTKAALTMFSSIMRQELSAWGVKVSVVQPGGFRTNIAGTNDVWLKNEKDILDHLTQEQLRDYGRDYVLLQKNFLNKFESFTCPDFTPVLRDIQHAISAQSPSPFYMPGKMVSLWVYFAFLSPTHLFDYCVKKIFVKSEYIPRALHMPN +>XP_004843004.1_PREDICTED:_60S_ribosome_subunit_biogenesis_protein_NIP7_homolog_isoform_X1 +MRPLTEEETRVMFEKIAKYIGENLQLLVDRPDGTYCFRLHNDRVYYVSEKMLKLAANISRDKLVSLGTCFGKFTKTHKFRLHITALDYLAPYAKYKVWIKPGAEQSFLYGNHVLKSGLGRITESTSQYQGVVVYSMADIPLGFGVAAKSTQDCRKVDPMAIVVFHQADVGEYIRHEETLT +>XP_012928987.1_PREDICTED:_sperm_flagellar_protein_2 +MSESLCQWLNQELKVSRTVNPKSFAKAFSSGYLIGEVLHKFELQDDFSEFSDSRISTARLNNFSRLEPTLHLLSVQFDKNMVQSIITEKPGAATKLLYQLYIALQKKKKSGLTGVQIPTTQPLASLKFQNMKSEASREQRLNRRRQNEIMAKIQAAIIQIPKPASNRTLKALEAQKMMKKQQEAADVADEIMKFEALIEKDLQAKESAFRTGLDTADHTTTDLLNTYSDDDYIKKIQKRLEEDAFAREQREKRRRRLLMDQLIAHEAQEEAYREEQLIHRLMRQSQQERRIAVQLMHVRHEKEVLRQNRIFREKQYEERRLKDFQDALDREAALAKQAKIDFEEQILREKEVHEKIAVERVQARYTKHYKICGEILDQILDLSTKVADYRMLTNNLIPLKMMRDWKELFFHGKPIYEQTSIKHMPANPSEEQLRELDKRDLLDSKDYEEYKNMVGEWTVPEEMVDNLPPSNNSILGHVLHRLIEKSLPPQAEPTEPEMPSFAIKGCVLGKTLSGKTITLNTLQREFPIQVLCVDTLVQEAIQAFYDNEEVSGDLPIQKEGGKSPSDLQKDSKESQDSHNVSSDAPVSGESLPETEGETRSTHTNRTPKPEEVKSSDSNNFSKLTVRAQLGAKSQQLLKKGKSIPDTLLVNIIVNAVNEIPVNQGWILDGFPMTLNQTQLLEEALIGCNRSLIEMETKKTQISTLAVDPMSSKEVPLPSSAFDFVILLDISDSFLLSRMNDIIAEEFSHEMAHKDIGQHGTAENQDKHGYQNLRDHIQNRIIGFLDNWPLLEQWFSEPENILIKINAEIDKEPLFQKLKEIFATEIVKKRNKVEKKLEEKEAEKKAIASLAESLPLPPPPPEPEKEKEIQAQHKQEPSKTPPAKGKPQSETPHDKQEPLHEGKGKKGSHKGKTPGGKTPIKKSPAQSTEVSPTPVGPPPPKPGSEEWVYVSEPVPEEVPSFLVPYWQLIENSYINTIKTALRHLREDQHSVLAYLYEIRTSFQELLRAPDYKQEFVSQWQADFNSLPDDLWDDEETKAELHQRLNDLRERLWDICDARKERAEQERLDIIKERWFQDSLRITTTHFSSLMQAELNCFQDTKRFLQDYYRAMECKSPIEDNKKFTRVTLVQMDAKDVSETQLRFPPSVPRISISPETAMPKPKVKAIMKNKIDSSLENIVSNFEANENLVMDTWQQASSAVSHMVAAEIHQRLMEEEKGNQPADSKEKSPQMGANKKVKKEKEATKKKEADKKAKDKSPPIEEATSVIVTAEEMAKIERKNELSLKIKEEHIAALQFEEKATQFRLELIKAKALTVLEDAVIQVIDVYKIMEKWLGERYLNEMASIEKLTEVARYHIETATKIQKELYLGQEDFFINDDIKVFPDPPPPTRPLPVEKEENGTLTIEQLGNLGDQFLDIAPKGLVRNKTFTDILLDLITLNLGTNSLPSSWMHLSQSELQELTSLLVVNSEFVDCWKFLLVAAMPWPIPLEEELLETLQRFKAVDEAQTGNINFEQYMQAGLWFSGDEEMKIPENPLEPLPFNRQEHLIEFFFMLFADCEKDPPQLDYTQMLLYFACHPDMVEGIYRALSVAVGTHIFRRLKTPLLAAGKTSFSPGMSPIEEFPKLEDKDGREERELKEESDEGEQKEKEKANTEKISMETLLTVFRGGNEAQDTNRFVSHLKIENIYAENFTKTFQDLGVKNMELIEIALLLKHPFIQELIANYLDYKIPVIKKILQRNGHGQRSDEERSPSRFTEEKK +>XP_012924274.1_PREDICTED:_extracellular_calcium-sensing_receptor +MSCSKRESSQGPQITITIESLSWREGRIMASYSCCLVLLALAWHSSAYGPDQRAQKKGDIILGGLFPIHFGVAAKDQDLKSRPESVECIRYNFRGFRWLQAMIFAIEEINSSPALLPNMTLGYRIFDTCNTVSKALEATLSFVAQNKIDSLNLDEFCNCSEHIPSTIAVVGATGSGVSTAVANLLGLFYIPQVSYASSSRLLSNKNQFKSFLRTIPNDEHQATAMADIIEYFRWNWVGTIAADDDYGRPGIEKFREEAEERDICIDFSELISQYSEEDEIQQVVEVIQNSKAKVIVVFSSGPDLEPLIKEIVRRNITGKIWLASEAWASSSLIAMPEYFHVVGGTIGFALKAGKIPGFREFLQKVHPRKSVHNGFVKEFWEETFNCHLQEGAKGPLPMDTFLRGHEEGNSKLSNSSTAFRPLCTGEENISSVETPYMDYTHLRISYNVYLAVYSIAHALQDIYTCLPGRGLFTNGSCADIKKVEAWQVLKHLRHLNFTNNIGEQVTFDEYGDLVGNYSIINWHLSPEDGSIMFKEIGNYNVSANKGVRLFINEEKILWSGFSREVPFSNCSRDCLAGTRKGIIEGEPTCCFECVECPDGEYSDETDASACDKCPDDFWSNENHTSCIAKEIEFLAWTEPFGIALTLFAVLGIFLTAFVLGVFIKFRNTPIVKATNRELSYLLLFSLLCCFSSSLFFIGEPQDWTCRLRQPAFGISFVLCISCILVKTNRVLLVFEAKIPTSFHRKWWGLNLQFLLVFLCTFMQIVICVIWLYTAPPSSYRNHELEDEIIFITCHEGSLMALGFLIGYTCLLAAICFFFAFKSRKLPENFNEAKFITFSMLIFFIVWISFIPAYASTYGKFVSAVEVIAILAASFGLLACIFFNKVYIILFKPSRNTIEEVRCSTAAHAFKVAARATLRRSNVSRKRSSSLGGSTGSIPSSSISSKSNSEDPFPQAERQKQQRPLALTGQEQQQQPVTLQPQQPQQSQPQPRCKQKVIFGSGTVTFSLSFDEPQKNAMAHRNTTHQNSLETQKSNDGLSRHQALLPLQYRDTDSGLTTQETGQQGMVAGDHQPELEDPEEMSPALVMSKSRSFVISGGGSTVTENILHS +>XP_004840002.1_PREDICTED:_up-regulator_of_cell_proliferation_isoform_X2 +MEGDDCGFHYGDGTNEAQDNDFPTVERSRLQEMLSLLGLEAYQAQKLSLQDSLQISFDSMKNWAPQVPKDLPWHFLRKLQALNAEARNTTMVLDMPADARPAEKESQMEEEMIYWDPAEDIAADDIYSFSELPTPDMPVNPLDLLCALLLSSDSFLQQEIVLKMSLCQFALPLVLPDSENHYHTFLLWALRGVVWTWWSQTPRGLGSFREDSVVLSRVPTFAFVRMDVSSNSKSQLLNAILSLGRRQWDCFWHRDLSLGTNPREIADGLVEISWFFPSGRDDLDIFPEPVAFLNLRGDIGSHWLQFKLLTEISSAVFILTDNISKKEYKLLYSMKESTTKYYFILSPYRGKRNTNLRFLNRLTPVLKIDHSHVLVKVSSTDSEGFVRRLRAIVASVVRAPCRRVSVEDMAHAARKLGLRVDEDFEECQKAKDRMERITRKIKDVDAYRRDELRLQGDLGRKVAQVEREFCQLQWAPEPPEKHRVELRRRLLELRAQQSGQEPSMGLQDFIVGISSPSEGERQYFLRWMEWGLARVGHPRLRQPPETLLALRPKLGGASDFSEPLWPEPLGIEHFLREMGQFYESESCLVEAGRLPAGQRRFAHFPGLATELLLAGLPLELVDGGTLSIPIHWVTGLLKELHIRLDRRSRLVVLSTLGVPGTGKSTLLNTMFGLRFATGRSCRPRGAFMQLITVAEGFSQDLGCDHILAIDSGALISGALVSAGDRFELEASLATLLMGLSNVTVVSLAETRDIPPAILHAFLRLEKRGHMPNCQFVYQSLHDVPAPSPKPRERRQLLDPPGDLGRAAQVEKQSGSFRTLAGLAFCDPERQHVWHVPGLWHGAPPMAAVSLGYSEAIFELKRCLLENIRNGLSNQNKNIQQLIELVRRL +>XP_004852209.1_PREDICTED:_liprin-alpha-1_isoform_X2 +MMCEVMPTISEAEGPPGGSGSHGSGSPSQPDADSHFEQLMVSMLEERDRLLDTLRETQETLALTQGKLHEVGHERDSLQRQLNTALPQEFAALTKELNVCREQLLEREEEIAELKAERNNTRLLLEHLECLVSRHERSLRMTVVKRQAQSPAGVSSEVEVLKALKSLFEHHKALDEKVRERLRVALERCSLLEEELGATHKELMILKEQNNQKKTLTDGTLDVNHEQENTPSTNGKRSSDGSLSHEEDLAKVIELQEVIDKQSREQSQMKERLAALSSHVSELEEDLDTARKDLIKSEEMNTKLQREVREAMAQKEDMEERITTLEKRYLAAQREATSVHDLNDKLENEIANKDSIHRQTEDKNRQLQERLELAEQKLQQTLRKAESLPEVEAELAQRVAALSKSDPLPTGSSAVKEAKLFELTSKLRKAEERHGNIEERLRQMEAQLEEKNQELQRARQREKMNEEHNKRLSDTVDKLLSESNERLQLHLKERMAALEDKNSLLREVENAKKQLEETQHDKEQLVLNIEALRAELDQMRLRGASLHLGRPHLGSVPDFRLPMADGHTDAYSTSAVLRRPQKGRLAALRDEPSKVQTLNEQDWERAQQASVLANVAQAFESDVDVSDGEDDRDTLLSSVDLLSPSGQADAQTLAMMLQEQLDAINKEIRLIQEEKENTEQRAEEIESRVGSGSLDNLGRFRSMSSIPPFPASSLAGSSPPGSGRSTPRRVPHSPAREVDRLGVMTLSPASREEVRDDKTTIKCETSPPSSPRSLRLDRLHKGALHTVSHEDIRDMRNSTGSQDGPVSNPSSSNSSQDSLHKAPKKKGIKSSIGRLFGKKEKGRPGQTGKESPGQAGVSETENSSQDALGLSKLGGQAEKNRKLQKKHELLEEARRQGLPFAQWDGPTVVVWLELWVGMPAWYVAACRANVKSGAIMSALSDTEIQREIGISNPLHRLKLRLAIQEIMSLTSPSAPPTSRTTTGNVWLTHEEMETLAATPQTEDEEGSWAQTLAYGDMNHEWIGNEWLPSLGLPQYRSYFMECLVDARMLDHLTKKDLRGQLKMVDSFHRNSFQCGIMCLRRLNYDRKELERKREESQNEIKDVLVWSNDRVIRWILSIGLKEYANNLIESGVHGALLALDETFDFNALALLLQIPTQNTQARAVLEREFNNLLVMGTDRRFDEDDDKSFRRAPSWRKKFRPKDIRGLAAGSAETLPANFRVTSSMSSPSMQPKKMQMDEAETSFSLLREVVLATAPAAVPLHLRPTPESSSVSGTQRLDSATVRTYSC +>XP_012923746.1_PREDICTED:_probable_phospholipid-transporting_ATPase_VA +MECAGPWRRHGDSGARTVRSGLLPGAPALGLRAPPAADNRLRTTKYSLLSFVPKNLFEQLHRLANVYFVLIALLNFAPPVSAFQPGLALAPVLFILAVTALKDLWEDLSRHRSDRAINHRACLVFGREEKTYVSRFWKEICVGDFVRLRCNEIIPADILLLSSSDPDGLCHIETANLDGETNLKRRQVVHGFSELVSEFNPLTFTSVIECEKPNNDLSRFRGCIMHGGGEKAGLRKENLLLRGCTIRNTEAVVGIVIYAGHETKALLNNSGPRYKRSQLERQMNSDVLWCVLLLICMSLFSAIGHGLWVRRYQEKKALFDVPESDGSSLSPVTAAVYSFLTMIIVLQVLIPISLYVSIEIVKVCQVYFINQDIDLYDEEMDSRLQCRALNITEDLGQIQYIFSDKTGTLTENKMVFRRCTVSGVEYSHDANAQRLARYQEADSEEEEMLPKRASWPQHSSIGSCQSVRIVHRTQSTKSHWRSGGRAEAKRASELSRHTAFSSPMEKDITPDPKLLEKVSECAKCLAVARHQEQPLARLSAELADVFDFFLALTICNTVVVTSADQPRQKQVRVRFELKSPVKTLEDFLRRLTPSRLASTCSSTGSLATAKTSPKSGSGFLSSLSSDSMFLKLEERRGQSAPSIASNGYSSPAESWALEQKPEAGHEGELHYEAESPDEAALVYAARAYRCALVDRLPDQVSVELPHLGRLTFQLLHTLGFDSTRKRMSVVIRHPLTDEINVYTKGADSSVMDLLLPCSSEDARGRHQKRIRSKTQSFLNLYAVEGLRTLCIAKRVLSKEEYACWLQGHLEAESSLDNREELLFQSALRLETNLHLLGATGIEDRLQAGVPETISKLRQAGLQIWVLTGDKQETAVNIAHACKLLDHDEEIITLNAESQEACAALLEQCLQYAQSRGPCSTPEKTQGDISMGPFALCSASKPAASGPSLSLVIDGRSLAYALEKNLEDKFLFLAKQCRSVLCCRSTPLQKSMVVKLVRSKLKAMTLAIGDGANDVSMIQVADVGVGISGQEGMQAVMASDFAVPKFRYLERLLIVHGHWCYSRLANMVLYFFYKNTMFVGLLFWFQFYCGFSASAMIDQWYLIFFNLLFSSLPQLVTGVLDKDVPADVLLTEPQLYKSGQEMEEYRPRAFWLNMVDAAFQSLICFFIPYLAHYDSDVDISTWGTPITVTALLTFLLHLGVETKTWTWLNWMACGFSVLLFLSVALIYNSACSTCYPPSNPYWTMQTLLGDPVFYLICLITPVTALLPRLFVRALQGSLFPTQLQLGHQLAKKCRETLKTPRETFAQGHLPGEPQTELSPRSTSNESLAPDCASQASRHTQQLPACSPEARGEPSAVDTSVPRRENSLLGSPGSSTPGEAVSGECPGHLQRTPLSTGQASPLSLFSSLGWVSSLVPVSGLGSVLRFSRSSLHVDKRDSGFLPSPPQPEQDLCGSQRPAANF +>XP_012929377.1_PREDICTED:_tetratricopeptide_repeat_protein_21A_isoform_X5 +MCSSDSSLLAGIIYYSQEKYFRHVQQAAAVGLQKFSNDPVLQFFKSYGVLREERVQDAISELENIRGHPDLSLCSVMALLYAHKCCEIVDREAIQELETSLKEVREQASETALYYAGLFLWLIGRHDKAREYVDHMLNASSSFRELHPQGYVLKGWVDLTSEKPHIVKKSIKYLEQGMQSNKDVLGLMGKATYLMIQQNYSGALDVVNQISTASGSFLPALVLKMRLFLAQQDWEQTMETTHRILEKDESNIDACQILTVHELVREGNMTTATDNVRNLIKALEMREPQNPSLQLKKILVISRLCGRHRAILRLVSSFMERIFLAMPSCAQVATELGYLFILQNQEKEAALWYSEAMKLGENSVAALTGTIWCHILKDELEEAEHQLEFLKEVQQSLGRSEVLVFLQALLASKKHKGEQEVTALLQEVVELHFSHLQGLPLSPEYLEKLDPPFLVCIAKEYLQFCPKQPRAPGQLVSPLLKQAAVILSPVVRAAPALPDPLYVMGQVKYLSGELENAQSTIQRCLELDPTSADAHLLLAQIYLAQGNFAMCSHCLELGVSHNFQVRDHPLYHFIKARALSKSGDYQEAIKTLKMIMKLPTLKTEESRKIRGPSVQPSERVSILLELVDALRLNGELHEATKVMQDTINEFSGTAEEIRITIANVDLALSKGNMDLALSMLRNITPKQPCYTEAKEKMASIYLHSRKDTCLYIGCYRELCEHLPGPHTSLLLGDAFMNIQEPEKALEVYNEAYKKNPHDASLVSRIGQAYVKTHQYSKAINYYEAAQKISGLDFLCCDLAELLLKLKKFNKAEKVLKQALGHDVVKDIPSMMNDVKCLLLLAKVYKSYKKEEVLETLNKALNLQSRILKRVPLEQPEMLPSQKQLAASICMLFGEFYSAEKDYAKAVQSYRDALSYSPTDNKVVLELAHLSLLQGYLDLSEQHCVILLQTDQAHETASLMMADLMFRKQNYEAAINLYHQVLEKAPDNFSVLDKLIDLLRRSGKLDEAPAFFQLVKKMSSRVSMEPGFNYCRGIYCWHIGQPNQALKFLNKARKDITWGQRANYYMVHICLNPDNEIMGGEAFENQLTNTKKESEQQGVRTAEKLLRDFYPLSVIGQTQQRLLQSLCLLATREKANMEAALGAFLEIAQAEKDSIPALLGVSQACMLLKQVPKARTQLKRLAKVPWTLVEAEDLERSWLLLADIYSSGGKFDLASELLRRCIQYNKSCYKAYEYMGFIMEKEQSYKDAATNYELAWKYSHQANPAIGKAASKVPVSRCGREAGTGPHSDSRTQGLYPGSWGNQRGSHLLRMPPSVISLFPGQVSDLLSTI +>XP_004856054.1_PREDICTED:_general_transcription_factor_3C_polypeptide_1_isoform_X2 +MDALESLLDEVALEGLDGLCLPALWSRLESRVPPFPLLLEPYTQEFLWRALATHPGISFYEEPRERPDLQLQDRYEEIDLETGILESRRDPVSLEDVYPIHMILENKDGIQGSCQFFKERKNITSNIRSKSLQPRCTMMEAFDRWGKKLIIVASQDMRYRALIGAEGDPDLKLPDFSYCILERLGRSRWQGELQRDLHTTAFKVDAGKLHYHRKILNKNGLITMQSHVIRLPTGAQQHSILLLLNRFHVDRRSKYDILMEKLSGMLSTRSNRIETLGRLREELGLCERTFKRLYQYMLNAGLAKVITLPLQEIHPECGPCKTKKGTDVMVRCLKLLKEFKKKVEDDHDDDDDEEVISKAVLPVDIVYERDMLTQTYDLIERRGTKGISQAEIRVAMNVGKLEARMLCRLLQRFKVVKGFMEDEGRQRTTKYISCVFAEESDLSRQYAREKARGELLTTVSLASMSEEPLLPEGEDAFLSESDSEEEGSRVSKRRARGAQPHVRPSAEFGPGAQPQHSTPTKGGWKLLNLHPLKRQLPSSPGAAEERASRSSGARDNLDTSGSSDFNVSFGSHCMESASGDIAMIEEVRLDNPKESGSSQKAGKHSTGLEKPHKTYRLLKRRNLIIEAVTNLRLIESLFTIQKMIMDQEKQEGVSTKCCKKSIVRLVRNLSEEGLLRLYRTTVIQDGIKKKVDLVVHPSMDQNDPLVRSAIEQVRFRISNSTTANRGKVPQPPAPPEEVEEESQGQEEPSRSGDCDMNASSKPESGRGKKTDEKMGVTPMKNYHPVVVPGLGRSLGFLPKMPRLRVVHTFLWYLIYGHPACYVMEKPVLFGSERRGGRHPRGDWDASDLRDNPDGVTWETEVELSTETVYVDDASWMRFIPPIPVHRDFGFGWALVSDILLSLPLSIFVQIVQVSYKVDNLEEYLNHPLKQHTLIRFLPRPIRQQLLYKRRYIFSVMESLQRLCYMGLLQFGPTEKFQDKDQVFVFLKKKAVIIDTTICDPHYNLAHSSRPFERRLYVLNSMQDVESYWFDLQCVCLNTPLGVVRCPAVPKNSADHASDEEGSLRKEQEKAVDKHNLERKCAMQEYTTGSREIMDEGHIPGDGLGAAGLDSSFYAHLKRNWIWTSYIINKARKENITAENGLTVRLQTFLSKRPLPLGAAGSSRLPLWGEAKAGSELSAHREQFGMEREPTLGRSRRVKGGRNQKRKRLRKDPVRRTKRRRKEELPGAKIKRPRYHDEADQSALRRMTRLRVSWSTQEDGLLVLCRIASNVLNSKVKGPFVPWQVVRDILHATFEESLDKTSHSVGRRARYIVRNPQAYMNYKVCLAEVYQDKALVGDFMNRKCDYEDPKVCAKEFKEFVEKLKEKFSSALRNPNLDIPDTMQELFARYRVLAIGDEKYRTRKEDELSSVEDIQFLVLQNLIQSTLSLSNSQVKSCQSFQMFRLYREYKEPVLVRAFMECQKRSLVNRRRVSHTTGPKKNRALPFVPMSYQLSQSYYRLFNWRFPSTICTESFQFFDSLRAAGRLDQSDPFCFKDQDNSEPPAGMVAFSLDGPGGHCATALTLWSLGLVSVDVRIPEHILVVDSAIMKSLGKDGALEDEEDEEEDLDEGTGAKRAGVEVKAHQASHTKYLLMRGCCVPGLISTRNLNPNDSVVVNSCQVKFRLRCSPLDTQLKPADPSLQELTEGTSCLPNSFTRLMEPPGNMVSREEFARHGVLSGYSPEDLSAAQEIWQAVVSAGCFGIDKEKLSSQFLALENTAGSKTFQDYIQDLLAWSQVLEVGSNTVRLVAMAFARPWLLHSVRLKDTEEDAPATLPEGPASERLAPPSQSTKRRPRWASQSSDTDADTDAEYTRKPPAKRLMLQHVHWAPGPRLAAEEGVETLAWAPPLALEDPGAGGTGQEDQERGLPSSLGPEPLSTQAQLPEGSEDPRGLLDATGAGGLSQAPPEKDCEDICFIGRPWRGVDGLLNMPVCKGMMEALLYHVMSKPGVPESSLLQHYQGVLQPVAVLDLLQGLESLGCIRKRVLRKSPTVSLFSEPGVAGPGPEVPLGLSGSTEAFYEPTLDCTIRLGRIFPPKVNWNKWIHL +>XP_012923428.1_PREDICTED:_GON-4-like_protein_isoform_X4 +MLPCKKRRTTVTENSQDKSSQEEDNLDQESAVKPESDLLKDLGSVSLSWGPSHGRTVGFEVQSVQNVGNQPGVEAPLLSSRILTQDTNLPSLEAVDEAISQEITLTSLESSHSPNVHIGKGKLQATASKRGKKVVIRPGLVTQEDRGDLPIMKKPFAGEPGEEVKEEGEEQSSEENEKRRKKKKGTKRKRDGRGQEQGALACDLKLDDVLDRTLEDGAKQHNLTAVNVRNILHEVITNEHVVAMMKAAISETEDMPMFEPKMTRSKLKEVVEKGVVIPTWNISPIKKANEIKPPQFVDIHLEEDDSSDEEYQPGEEDEDETAEESLLESDVESTASSPRGAKKSRLKQSSEIAETDEESGVLLEAEKVTTPAIRHISAEVVPMGPPPPPKPKQTKDSTFMEKLHAVDEELASSPVCMDSFQPLDDSLIAFRTRSKMPLKDVPLGQLEAELRAPDITPDMYDPNTADDEDWKVWLGGLMNDDVGNEDEADDDDDPEYNFLEDLDEPDTEDFRTDRAVRITKKEVNELMEELFETFQDEMGFSNMEDDGPEEEERVAESRPNFNTPQALRFEEPLANLLNEQHRAVKELLEQLKMKKSSARQQQEVEKLKPQAEKVHQTLILDEVQRKRLQEQMQQHVQLLTQIHLLASSNPNLSSEASTTKIFLKELGTFAQSSTALHHQSNPTFQTLFQPCNLMGAMQLIEDFSTHVSVDWIPPKTMRKNGHEFFCLPKQVAWILATSKVFMYPELLPLCSLKAKNPQDKLIFTKAEDNLLALGLKHFEGTEFPKPLISKYLLTCKTAHQLTVRIKNLNLSRAPDNVVKFYKKTKQLPVLSKCCEEVQPHERKPPLEREEHRLPFWLKASLPSIQEELRLGAHDGRAVGNGTGTTEVSADRGLEKARSEPGSETRYPLLLPKGVVLKLKPVANRFSRKTWRQKRSSVPPSKMVVRVPQLIQPAAVLQPAPGVPPLGLSGDNSFESPAALSTVPPEARTSFLLSESQALPPSAPVPKVMLPSLGPRFRKPCVRRKPSRRKGAKVFPCPKPAPLIHSAPVIFTVPATTVKVVSLGSGCNVIQPVSAAVARSPQTIPITTLLVNPASFPCPLSQPLVASSISPLIVSGNSVNLPVSSTPEDKARVNVDISCPLAEGKNAFQSLEPKLEPQEVTPLCAPVFPKEEYGPRPLLAGREGREGQVGLSANSACGWTVVSKEEGRQGLEPLPQGFHGIRNSSPADLKEAVKMEPEDPGEAISSGPPEQRIGDEIKKERFVEWDSGSPREGLSSARVLKKQAVLQEEEDRSQPAQTPSASWEPPGEGSAVGDGSSAPSSVEPEMALSSAPGKPEEASGVGGPSAGGPAGPEVGGEKDGPEEEEEEDFDDLTQDEEDEMSSASEESVLSVPELQETMEKLTWLASERRMSQEGESEEENSQEENSEPEEEEEEEAEGVESLQKEDEMVDDTGGDTAEKPPSTLASPTTAPEVETCRIPAGENIKAAGKGRSSHRARTKRGSRARASKDASKLLLLYDEDILERDPLREQKDLAFAQAYLTRVREALQHIPGKYEDFLQVIYEFESSSQRQTAVDLYKSLQILLRDWPQLLKDFAAFLLPEQALACGLFEEQQAFEKSRKFLRQLEICFAENPSHHQKIIKVLQGCADCVPHEITELKTQMWQLLKGHDHLQDEFSIFFDHLRPAASRMGDFEEISWTEEKEYEFDGFEEVALPDVEEEEEAPKIPTASKNKRRKEAGAQNHDKETEWPDGAKDCACSCHEGGPDSKLKKSKRRNCSHCSGTKVCDSKPYKHKEPPESVSSSPHGEASPGRSAKEAGPGKELGEEEALEDPESTDAPQSRAGRAARKGEAPIPGSAVRSLLLSPQEVPLTDHLPEGPPAPPETPQCPPPTAAELDAVQRSQAGPEGPSASACARPEEGASRKAAGDSEAASRGWDALQPEPLLGTVETPAPSLSPASSRTRVIGRRLTPGKPDPQDSWLPSSRAGARRANRTSPGHEPSTGMDTSETAPEAPKRSLAKDGGVQGRGLEGEQQLKATEATVCANNSKGSGPSDPHHVSGTGSAAADLQQHLSAAGKQDPSRGLPPLPRTHAALPHGL +>XP_012922795.1_PREDICTED:_protein_numb_homolog_isoform_X1 +MNKLRQSFRRKKDVYVPEASRPHQWQTDEEGVRTGKCSFPVKYLGHVEVDESRGMHICEEAVKRLKAERKFFKGFFGKTGKKAVKAVLWVSADGLRVVDEKTKDLIVDQTIEKVSFCAPDRNFDRAFSYICRDGTTRRWICHCFMAVKDTGERLSHAVGCAFAACLERKQKREKECGVTATFDASRTTFTREGSFRVTTATEQAEREEIMKQMQDAKKAETDKTASASSVASGNTAPSPSSPTSPTSDTTASLEMNNPHAIPRRHAPIEQLARQGSFRGFPALSQKMSPFKRQLSLRINELPSTMQRKTDFPIKNAVPEVEGEAESISSLCSQITNAFSTPSEDPFSSAPMTKPVTVVASQSPAFQANGSDSAFHVLSAKPAHTALAPIAMPVRETNPWAHAPDAANKEIAATHPGTEWGPSSPDLLQAGHRRTPSEADRWLEEVSKSVRAQQPQASAVPLQPVLQPPPPAAISQPSPPFQGSAFLTSQPVPVGVVPPLQPAFVPTQSYPVANGMPYPAPNVPVVGITPSQMVANVFGTAGHSQVAHSRQSPSLVKQQTFPQYETSSAATTSPFFKPPAQHLNGSAAFNGVDDGRLASGDKHTEFPAGTCPVDPFEAQWAALESKSKQRTNPSPTNPFSSDLQKTFEIEL +>XP_004840188.1_PREDICTED:_protein_CASP_isoform_X7 +MAANVGSMFQYWKRFDLQQLQRELDATATVLANRQDESEQSRKRLIEQSREFKKNTPEDLRKQVAPLLKSFQGEIDALSKRSKEAEAAFLNVYKRLIDVPDPVPALDLGQQLQLKVQRLHDIETENQKLRETLEEYNKEFAEVKNQEVTIKALKEKIREYEQTLKSQAETIALEKEQKLQNDFAEKERKLQETQMSTTSKLEEAEHKLHSLQTALEKTRTELFDLKTKYDEETTAKADEIEMIMTDLERANQRAEVAQREAETLREQLSSANHSLQLASQIQKAPDVAIEVLTRSSLEVELAAKEREIAQLVEDVQRLQASLTKLRENSASQISQLEQQLSTKNSTLKQLEEKLKGQADYEEVKKELNILKSMEFAPSEGAGTQEAAKPLEVLLLEKNRSLQSENAALRISNSDLSGRCAELQVHVTEAMAITAEQRELIARLEQDLSTIQSIQRPDAEGAAEKIPEPIKEATALFYGPVAPASGSLPEGQVDSLLSIISSQRERFRARNQELEAESRLAQHTIQALQGELDSLRADNIKLFEKIKFLQSYPSRGSSSDDTEQRYSSQYEERLDPFSSFSKRERQRKYLSLSPWDKATLSMGRLVLSNKMARTISFFYTLFLHCLVFLVLYKLAWSESVERDCTATCAKKFADHLHKFHENDNGAAAGDLWQ +>XP_004856655.1_PREDICTED:_neural_cell_adhesion_molecule_1_isoform_X10 +MLQTKDLIWTLFFLGTAVSLQVDIVPSQGEISVGESKFFLCQVAGDAKDKDISWFSPSGEKLSPNQQRISVVWNDDSSSTLTIYNADIDDAGIYKCVVSGEDGSESEATVNVKIFQKLMFKNAPTPQEFKEGEDAVIVCDVVSSLPPTIIWKHKGRDVILKKDVRFIVLSNNYLQIRGIKKTDEGTYRCEGRILARGEINFKDIQVVVNVPPTVQARQSIVNATANLGQSVTLVCDAEGFPEPTMSWTKDGEPIENEEDDEKYIFSDDSSELTIRKVDKNDEAEYVCIAENKAGEQDASIHLKVFAKPKITYVENQTAMELEEQVTLTCEASGDPIPSITWRTSTRNISSEEKASWTRPEKQETLDGHMVVRSHARVSSLTLKSIQYTDAGEYICTASNTIGQDSQSMYLEVQYAPKLQGPVAVYTWEGNQVNITCEVFAYPSATISWFRDGQLLPSSNYSNIKIYNTHSASYLEVTPDSENDFGNYNCTAVNRIGQESLEFILVQADTPSSPSIDQVEPYSSTAQVQFDEPEATGGVPILKYKAEWRALGEEVWHSKWYDAKEANMEGIVTIMGLKPETTYAVRLAALNGKGLGEISAASEFKTQPVHSPPPPAPASSSTLAPLSSPAKGEPSAPKLEGQMGEDGNSIKVNLIKQDDGGSPIRHYLVKYRALSSDWKPEIRLPSGSDHVMLKSLDWNAEYEVSVVAENQQGKSKPAHFVFKTSAQPTAIPANGSPTAGLSTGAIVGILIVIFVLLLVVVDITCYFLNKCGLLMCIAVNLCGKAGPGAKGKDMEEGKAAFSKDESKEPIVEVRTEEERTPNHDGGKHTEPNETTPLTEPEKGPVEAKLECQESETKPAPAEVKTVPNDATQTKENESKA +>XP_004849847.1_PREDICTED:_phospholipid-transporting_ATPase_IA_isoform_X4 +MPAMRRTVSEIRSRAEGYEKTDDVSEKTSLADQEEIRTIFINQPQLTKFCNNHVSTAKYNIITFLPRFLYSQFRRAANSFFLFIALLQQIPDVSPTGRYTTLVPLLFILAVAAIKEIIEDIKRHKADNAVNKKQIQVLRNGAWEIVHWEKVNVGDIVIIKGKEYIPADTVLLSSSEPQAMCYIETSNLDGETNLKIRQGLPTTSDIKDIDSLMRIAGRIECESPNRHLYDFVGNIRLDGHGTVPLGADQILLRGAQLRNTQWVHGIVVYTGHDTKLMQNSTSPPLKLSNVERITNVQILILFCILIAMSLICSVGSAIWNRRHSGKDWYLNLSYGGANNFGLNFLTFIILFNNLIPISLLVTLEVVKFTQAYFINWDLDMHYEPTDTAAMARTSNLNEELGQVKYIFSDKTGTLTCNVMQFKKCTIAGVAYGQNSQFGDEKTFNDPSLLENLQNNHPTAPIICEFLTMMAVCHTAVPEREGEKIIYQAASPDEGALVRAAKQLHFVFTGRTPDSVIIDSLGQEERYELLNVLEFTSARKRMSVIVRTPSGKLRLYCKGADTVIYERLAETSKYKEITLKHLEQFATEGLRTLCFAVAEISESDFQEWRAIYQRASTSVQNRLLKLEESYELIEKNLQLLGATAIEDKLQDQVPETIETLMKADIKIWILTGDKQETAINIGHSCKLLKKNMGMIVINEGSLDGTRETLSRHCTVLGDALRKENDFALIIDGKTLKYALTFGVRQYFLDLALSCKAVICCRVSPLQKSEVVEMVKKQVKVITLAIGDGANDVSMIQTAHVGVGISGNEGLQAANSSDYSIAQFKYLKNLLMVHGAWNYNRVSKCILYCFYKNIVLYIIEIWFAFVNGFSGQILFERWCIGLYNVMFTAMPPLTLGIFERSCRKENMLKYPELYKTSQNALDFNTKVFWVHCLNGLFHSVILFWFPLKALQYGTVFGNGKTSDYLLLGNFVYTFVVITVCLKAGLETSYWTWFSHIAIWGSIALWVVFFGIYSSLWPAVPMAPDMSGEAAMLFSSGVFWTGLLFIPVASLLLDVVYKVIKRTAFKTLVDEVQELEAKSQDPGAVVLGKSLTERAQLLKNVFKKNHVNLYRSESLQQNLLHGYAFSQDENGIVSQSEVIRAYDTTKQRPEEW +>XP_012924301.1_PREDICTED:_protein_ITFG3_isoform_X1 +MMDNKDVEAEIHPLKNEDRKSQESFGNRLKNEDNLKSMPAQSRLSRCRTVAFFLSLFICLFVVFVVSFIIPCPDRPVSQRMWKIDYNAAVTYDFLAMEDINRDKIQDVVFLYKNTNSSNNSNLSCADEGFSSPCAFVAAVSGANGSVLWERPVVQDVAFVECTTPQPSDHKVSSACILVGRPGSFLAVDLFTGETLWSHPSSFGGNTSILTPLLQVPDIDSDGAPDLLILTQEGKEVSVYIYSGSTGDQIGHRSSLGVDGVSGPLLHVTRTGAHYILLPCASSLCGCSLKGLYKKVTGRDGPFKSDPHWENMLNASTHRLLPSSGAVRYLMNVPGKAGQDVLLVSSQDCVLLDGQELTPRWTLGAAQVLRKPILGHYKPDTPAVVIENGTGINRQILLLDLSSGAILWSQTLPSFPGAPPPNSLPTADHRSAFFFWGLHELIGTNETDPRDARHSLYMFHPTLPSVLLELANVSANIIAFDVVLFEPSRHAAYILLTGPASLDVPGLVSMIKQKVRDLVPDSRVVHLGEGRPDSDQAIRGRFSWLRYRSEV +>XP_004861473.1_PREDICTED:_suppressor_of_cytokine_signaling_6 +MKKISLKTFRKSFNLSKSKEETDFMVVQQPSIASDFGKDDALFGSCYGKDMASCDINSEDEKGGKNRSKSESLMGTLKRWLSSKQKPKGKGSTPSGSCADEDTFSSSSAPMVFKDVRVKKPIRSTSLRSQHYTHTPWPRGPTNSEETYIKTEVRVKALVHSSSPSPALNAVRKDFHDLQSETVCQEQNNSLKSSDSPNGDLHFHLDEHVPVVIERKPQDYIQYTVPLDERMYPLEGSRSYCLNSSLPMEVSAVPPQVGGSSFAEDENEVNQDLVVAPEIFVDQSVNGLLIGITGVMLQSPRASRDDVPPLSPLVPTMQNNQIQRNFSGLTGTDAHVAESMCCHLNFDPYPNSAPGVARVYDSVQSSGPRVVASLTEELKKLAKQGWYWGPLTRWEAEGKLANLPDGSFLVRDSSDDHYLLSLSFRSHGKTLHTRIEHSNGRFSFYEQPDVEGHRSIVDLIKHSIRDSENGAFCYSRSPLPGSATYPVRLTSPVSRFMQVRSLQYLCRFVIRQYTRIDLIQKLPLPNKMKDYLQEKHY +>XP_004852439.1_PREDICTED:_ribonuclease_H2_subunit_C_isoform_X2 +MESGDESAMEKQRVHVRPATLHDSSPATLHLLPCEVLANRFAPVGRFFTPAIRQGADGLHVSFRGRSLRGEEVSVPPGLTGYVMVTEKREGLIGKQDFRGSENNGEEAQEPLERGFDQFIGATGSFSCFTVWGLETVPGPEAKVWGALTWPTLAAAIHAQVPED +>XP_004861051.2_PREDICTED:_centromere_protein_X_isoform_X3 +MESASAGFRKELVSRLLHLHFKDDKTKVSGDALQLMAELLRIFVVEAAVRGVRQAQAEDTALVDVDQLEKVLPQLLLDF +>XP_004850832.1_PREDICTED:_glucocorticoid_modulatory_element-binding_protein_1_isoform_X1 +MANAEVSVPVGDVVVVPTEGNEGENPEDTKTQVILQLQPVQQGLFIDGHFYNRIYEPGSENNTAVVAVETHTIHKIEEGIDASTIEANEDMEIAYPITCGESKAILLWKKFVCPGINVKCVKFNDQLISPKHFVHLAGKSTLKDWKRAIRLGGIMLRKMMDSGQIDFYQHDKVCSNTCRSTKFDLLISSARAPVPGQQTSVVQTPTSADGGITQIAISEESMEEAGLEWNSALTAAVTMATEEGVKKDSEEISEDTLMFWKGIADVGLMEEVVCNIQKEIEELLRGVQQRLLQAPFQVTDAAVLNNVAHTFGLMDTVKKVLDNRRNQVEQGEEQFLYTLTDLERQLEEQKKQAQDHRLKSQTVQNVVLMPVSTPKPPKRPRLQRPASTTVLSPSPPVQQQPQFTVISPITITPVGQSFSMGNIPVATLSQGSSPVTVHTLPSGPQLFRYATVVSSAKSSSPDTVTIHPSSSLALLSSTTMQDGSTLGNMATMVSPVELVAMESGLTSAIQAVESTSEDGQTIIEIDPAPDPEAEDTESKAVILETELRTEEKVVAEMEEHQHQVHNVEIVVLED +>XP_004860428.1_PREDICTED:_chondroitin_sulfate_glucuronyltransferase_isoform_X2 +MQVVSHGDERPAWLMSETLRHLHTHFGADYDWFFIMQDDTYVQAPRLAALAGHLSINQDLYLGRAEEFIGAGEQARYCHGGFGYLLSRSLLLRLRPHLDGCRGDILSARPDEWLGRCLIDSLGVGCVSQHQGQQYRSFELAKNRDPEKEGSSAFLSAFAVHPVSEGTLMYRLHKRFSALELEWAYSEIEQLQAQIQNLTVLTPEGEAGLSWPIGLPAPFTPHSRFEVLGWDYFTEQHTFSCADGAPKCPLQGANRVDVGDAVDTALEQLNRRYQPRLRFQKRRLLNGYRRFDPARGMEYTLDLLLEAVTQRGHRRALVRRVSLLRPLSRVEILPMPYVTEATRVQLVLPLLVAEAAVATAFLEAFAASVLEPREHVLLTLLLVYGPRDGGHGAPDPFLGVKAAAAELERRYPGARLAWLAVRAEAPSQVRLMDVVSKKHPVDTLFFLTTVWTRPGPEVLNRCRMNAISGWQAFFPVHFQEFTPALSPQRSPPGPPGAGPDPPSPPGSDPSRGAPVGGRFDRQASAEGCFYNADYLAARARLAGELAGQEEEEALEGLEVMDVFLRFSGLHLFRAVEPGLVQKFSLRDCSPRLSEELFHRCRLSNLEGLGGRAQLAMALFEQEQANST +>XP_012924399.1_PREDICTED:_protein_unc-13_homolog_B_isoform_X4 +MKRLLQESEEEIIVTLGPSSKLSPEKVKAETVCSIKNKSSGPAGSLPEDNSLLPCCGSAASVTGRDKDGDLVQLCSFGQHANSQLPLGSTSSVSESGSQDFSSASITTNCQESSERSQAKSLLSRGSGHEQREPLGDVVEYIIRELQGISRLQSEIAELQQHLSQVRGSVDEVSSCVDSVLSEIEGLHVGSSSLTKMCEPCMGRPNEEAILYLYGLPEQEGENTIELVDNFLAKHLCVNGIQCSRYIKEAYRAGKAPAPRPTVVKLAHLEHRDFILQKSILLQSVGVQVASREPSWSQSCKNLQMESISFLQQLQNHSENSLNQDKTVLQMKTWDRGPMTSSYQMRAQNQHREYQIPDQQSPCFQLKNNLTKESDKFKTGAEVKGTSGTSQAINGSCGKLAERKTSLSPLHQLKEPFLVLISKEEDSEKSQFFERYSQELEACKVAKLENDCSSKSEASSCLSLPGLLKTERINAEDKLLGCEAGLDILSSKQLEDLLADKSRRFATLSSDSMVEEMIIGPETFSNMVHIDLNEEEECAAQVLKDVFDKSSCVLGSLQEDEDVEVKFYTTKLGRAIHHFRSALQGVFQKLENSGSISLEDLESNESGSQSENSDRLLGTVSSRGAQDCSVESPGSQGSESLLSVVSGEVGISVQSNQTPQDPSNFSIASNNSPLTNSLPSITLASCLGNETSSRPESPKQGRLSLEQVCAETIYLNKCINNFKNVLREKRLRQKKLLHELVQKANHLSVEDIPSEGKQEVHQIPDDGNPCLPQWLPEGPAGGLYGIDSMPDLRRKKPLPFVSDLAMSLVQSRKAGITSAMATRTSFKDEELKSHVYKKTLQALIYPISCTTPHNFEVWTATTPTYCYECEGLLWGIARQGMRCSECGVKCHEKCQDLLNADCLQRAAEKSCKHGAEDRTQNIIMAMKDRMKIRERNKPEIFEIIRDVFTVSKVAHVQQMKTVKQSVLDGTSKWSAKITITVVCAQGLQAKDKTGSSDPYVTVQVGKTKKRTKTIFGNLNPVWEEKFHFECHNSSDRIKVRVWDEDDDIKSRVKQRLKRESDDFLGQTIIEVRTLSGEMDVWYNLEKRTDKSAVSGAIRLQISVEIKGEEKVAPYHVQYTCLHENLFHYLTDIQGSGGVQIPEARGDDAWKVYFDETAQEIVDEFAMRYGIESIYQAMTHFACLSSKYMCPGVPAVMSTLLANINAYYAHTTASTNVSASDRFAASNFGKERFVKLLDQLHNSLRIDLSTYRNNFPAGSPERLQDLKSTVDLLTSITFFRMKVQELQSPPRASQVVKDCVKACLNSTYEYIFNNCHDLYSRQYQLKQELPPEEQGPSIRNLDFWPKLITLIVSIIEEDKNSYTPVLNQFPQELNVGKVSAEVMWHLFAQDMKYALEEHEKDRLCKSADYMNLHFKVKWLHNEYMRDLPALQEQVPKYPAWFEQFVLQWLDENEDVSLEFLRGALERDKKDGFQQTSEHALFSCSVVDVFTQLNQSFEIIRKLECPDPRILAHYMRRFAKTIGKVLMQYADILSTNFPAYCTKEKLPCILMNNMQQLRVQLEKMFEAMGGKELDPEAADSLKELQVKLNAVLDELSMMFGNSCRYVDSPSTLADCRCWKSTVSLRN +>XP_004855288.1_PREDICTED:_molybdenum_cofactor_sulfurase_isoform_X1 +MAGGVAGPGAERPTFTRCWDPSTLRLAHGYGPRSVRELRESEFGRLAETVYLDHAGATLFPQSQLTNFTKDLLENVYGNPHSQNITSKLTHDTVEQVRYRVLAHFHTTPEDYSMVFTSGSTAALKLVAEAFPWVSRGPENGGSQFCYLTDNHTSVVGMRKVAEARNVTSTPVSPEDMWSAEERGALACEPDCQLPHLFCYPAQSNFSGTRYPLSWIEEVRSGRLSPANVPGKWFVLLDAASYVSTSPLDLSAHQADFVPISFYKIFGFPTGLGALLINNRVAPLLRKSYFGGGTAAAYLAGEDFYIPRPSVAERFEDGTISYLDVIALKHGFDALERLTGGMENIMQYTFMLAQYTHTALSSLRYPNGAPVVQIYSDSEFSSPDVQGPIINFNVLDNGGNIIGYSEVDKMASLYNIHLRTGCFCNTGACQRHLGISNEMVKKHLEAGHVCGDSLDLIDGQPTGSVRISFGYMSSVEDAQAFLRFIIATRLCLPGGQPVPQGSTGKAGAPSAEGKAQDTPAVTGRHCVSPQEGARMDSGVWNDSSSTVNSVDLCPAMGKATRTQPTPSEKAAGILPGDLGPHIVTNLYLYPIKSCAAFEVTRWPIGKHGLLYDRSWMIVNHNGICLSQKQEPRLCLIQPFIDLQQRIMVIKAKGMEPIEMPLEEDSGRVQICQSIVCTDRINTYDCGEKISSWLSEFLGRPCHLIKQSSNFQRNAKKHGKDQSTGITATLSLVNEAQYLLVNTSSILELHQQLNTSDENGKEKLFPMKDLISRFRANIIMNGTRAFEEEKWDEVSIGSLHFQVQGPCHRCQMICINQQTGQRNQDVFQKLSESRKRKVNFGVYLIHRSLDSSSPCFLSVGSQVFSVLKENVEHHDLPASEKCQDLVS +>XP_012925973.1_PREDICTED:_probable_E3_ubiquitin-protein_ligase_DTX2_isoform_X2 +MAMAPVPSLAQVYPSPVAVAVWEWQDGLSTWHPYSATVCSYIEQQFVQQKGQRFGLGSLAHSIPLGQADPSLAPYIIDLPSWTQFRQDTGTMRAVRRHLFPQHSAPGQGITWEWLGDDGSWTAYEASVCDYLEQQMARGIQLVDLAPLGYNYTVNYATHTQTNKTSSFCRNVRRQVGPPYPVTTVIAPPGHLGVACSCQQCLHGSGTGPVSGRYRHSMTNLPAYPIPQASHRTAVVFGAHQAFAPYNKPSLSGARSAPRLNATNPWGGAPSALGSQPFFRSSLSHLGPQLLVPGPSTSGGASASLPSGPSSSLGIVPATVPVQMSKPSKVQQALAGGAPKLEPEQVIRTYTEELKTPPDEDCMICMEKLSVVSGYSDVTDSKTLGPVAVGRLAKCSHAFHLLCLLAMYSNGTKDGSLQCPSCKTIYGEKTGTQPRGKMEVFRFQVSLPGHEDCGTILIVYSIPHGIQGPEHPNPGKPFTARGFPRQCYLPDNAQGRKVLELLKVAWKRRLIFTVGTSSTTGETDTVVWNEIHHKTEMDRNVTGHGYPDPNYLQNVLAELAAQGVTENCLEQQ +>XP_004874685.1_PREDICTED:_acyl-coenzyme_A_thioesterase_11_isoform_X1 +MWGATCGGTVLPVKAGTGCYRLGCGLAQAEGLGGEWPWGPPPKQLCFLATPGLQNQSFASVFSNRTSRKSVSRAGDEDTMANSEGDRNPTEVQMSQLVLPCHTNLRGELSIGQLLKWIDTTAYLSAERHAGCPCVTASMDDIYFEHTISVGQVVNIKAKVNRAFNSSMEVGIQVTSEDLCSEKQWTVCKALATFVAHQQLSKVKLKQINPRTEEEKTEHSVAAERRRMRLLYADTIKDLLANCTIKEDPESKDCSRMVPAEKTRVESVELVLPPHANHQGNTFGGQIMAWMENVATIAASRLCRAHPTLKAIEMFHFRGPSQVGDRLVLKAIVNNAFKHSMEVGVCVEAYRQEAEPHWRHINSAFMTFVVLDADDQPQKLPWIQPQPGEGERRYREASARKKIRLDRKYIVSCKQAEVPLSVPWDPSNQVYLSYNNVSSLKMLVAKSNWVLSSEISQVRLYTLEEDKFLSFHLEMVVHVDAAQAFLLLSDLRRRPEWDRHYRSVDLVQQVDEDDAIYHVISPGLGGNAKPQDFVILASRRKPCDNGEPYIIALRSVTLPTHPEVPEYRRGETLCSGFCLWHEGDQVTKVSYYNQATPGLLNYVTTNVSGLSSEFYSTFKACEHFLLDNRNDLAPSLQTL +>XP_004869957.1_PREDICTED:_olfactory_receptor_8K3 +MEKHNFTVVTEFILLGITYWPEMQAPLFLLFLVIYLTSMLGNLGMIILTQVDPRLQTPMYFFLRHLALTDLGYSTTVGPKMLVNFVEDQNIISYYGCATQLTFLAFLLGSELFILSAMSYDRYVAICHPLLYTVIMSPRVCWVLVAIPCLYCTFVSLLISVKIFSSSFCGPNVINHFFCDCIPLISLLCSTTHEVEFIIMIFTAFNSISSLLLVLMSYLLILIAILRMKSAEGRGKAFSTCGSHLTAVTVFYGTLIFTYLQPKSSHSFDTDKVASIFYTQINPLLNPLIYSLRNKDVKYALHRIWKNICKCFSLKT +>XP_004841721.1_PREDICTED:_myocyte-specific_enhancer_factor_2C_isoform_X1 +MGRKKIQITRIMDERNRQVTFTKRKFGLMKKAYELSVLCDCEIALIIFNSTNKLFQYASTDMDKVLLKYTEYNEPHESRTNSDIVETLRKKGLNGCDSPDPDADDSVGHSPESEDKYRKINEDIDLMISRQRLCAVPPPNFEMPVSIPVSSHNSLVYSNPVSSLGNPNLLPLAHPSLQRNSMSPGVTHRPPSAGNTGGLMGGDLTSGAGTSAGNGYGNPRNSPGLLVSPGNLNKNMQAKSPPPMNLGMNNRKPDLRVLIPPGSKNTMPSVSEDVDLLLNQRINNSQSAQSLATPVVSVATPTLPGQGMGGYPSAISTTYGTEYSLSSADLSSLSGFNTASALHLGSVTGWQQQHLHNMAPSALSQLGACTSTHLSQSSNLSLPSTQSLNIKSEPVSPPRDRTTTPSRYPPHTRHEAGRSPVDSLSSCSSSYDGSDREDHRNEFHSPIGLTRPSPDERESPSVKRMRLSEGWAT +>XP_012932605.1_PREDICTED:_receptor-type_tyrosine-protein_phosphatase_T_isoform_X3 +MLDPAVPTGSFMMVNSSGRASGQKAHLLLPTLKENDTHCIDFHYYFSSRDRSSPGALNVYVKVNGGPQGNPVWNVSGVVTEGWVKAELAISTFWPHYYQVIFESVSLKGHPGYIAVDEVRVLAHPCRKAPHFLRLQNVEVNVGQNATFQCIAGGKWSQHDKLWLQQWNGRDTALMVTRVVNHRRFSATVSVADTAQRSVSKYRCVIRSDGGSGVSNYAELIVKEPPTPIAPPELLAVGATYLWIKPNANSIIGDGPIILKEVEYRTTTGTWAETHIVDSPNYKLWHLDPDVEYEIRVLLTRPGEGGTGPPGPPLTTRTKCADPVHGPQNVEIVDIRARQLTLQWEPFGYAVTRCHSYNLTVQYQYVFNQQQYEAEEVIQTSSHYTLRGLRPFMTIKLRLLLSNPEGRMESEELVVQTEEDVPGAVPLESIQGGPFEEKIYIQWKPPNETNGVITLYEINYKAVGSLDPSADLSSQRGKVFKLRNETHHLFVGLYPGTTYSFTIKASTAKGFGSPVTTRIATKISAPSMPEYDTDTPLNETDTTITVMLKPAQSRGAPVSVYQLVVKEERLQNSRRAADIIECFSVPVSYRNASSLDSLHYFAAELKPANLPVTQPFTVGDNKTYNGYWNPPLSPLKSYSIYFQALSKANGETKINCVRLATKAPMGSAQVTPGTPLCLLTTGASSQNSNTVEPEKQVDNTVKMAGVIAGLLMFIIILLGVMLTIKRRRNAYSYSYYLKLAKKQKETQSGAQREMGPVASADKPTTKLSTSRNDEGFSSSSQDVNGFTDGSHGELSQPTLTIQTHPYRTCDPVEMSYPRDQFQPAIRVADLLQHITQMKRGQGYGFKEEYEALPEGQTASWDTAKEDENRNKNRYGNIISYDHSRVRLLVLDGDPHSDYINANYIDGYHRPRHYIATQGPMQETVKDFWRMIWQENSASIVMVTNLVEVGRHPAEHTVGNATLGRAASPGMVKCVRYWPDDTEVYGDIKVTLIETEPLAEYVIRTFTVQKKGYHEIRELRLFHFTSWPDHGVPCYATGLLGFVRQVKFLNPPEAGPIVVHCSAGAGRTGCFIAIDTMLDMAENEGVVDIFNCVRELRAQRVNLVQTEEQYVFVHDAILEACLCGNTAIPVCEFRSLYYNISRLDPQTNSSQIKDEFQTLNIVTPRVRPEDCSIGLLPRNHDKNRNMDVLPLDRCLPFLISVDGESSNYINAALMDSHKQPAAFVVTQHPLPNTVADFWRLVFDYNCSSVVMLNEMDSTQLCMQYWPEKTSGCYGPIQVEFVSADIDEDIIHRIFRICNMARPQDGYRIVQHLQYIGWPAYRDTPPSKRSLLKVVRRLEKWQEQYDGREGRTVVHCLNGGGRSGTFCAICSVCEMIQQQNIIDVFHIVKTLRNNKSNMVETLEQYKFVYEVALEYLSSF +>XP_004839166.1_PREDICTED:_dnaJ_homolog_subfamily_C_member_27_isoform_X1 +MEANLPKRKEPSKSLRIKVISMGNAEVGKSCIIKRYCEKRFVSKYLATIGIDYGVTKVQVRDREIKVNIFDMAGHPFFYEVRNEFYKDTQGVILVYDVGQKESFDALDAWLAEMKQELGPHANMDNIIFVVCANKIDCTKHRCVDESEGRFWAESKGFLYFETSAQTGEGINEMFQTFYVSIVDLCENGGKRPTTNSSASFTKEQADAIRRIRNSKDSWDMLGVKPGASREELNKAYRKLAVLLHPDKCVAPGSEDAFKAVVNARTALLKSIK +>XP_012933567.1_PREDICTED:_lethal(2)_giant_larvae_protein_homolog_2_isoform_X3 +MPSNPRTQEASGRHLSVGAFSRTLLDTFKATVLTSSLSSTLIGLQWAAANMRRFLRPGHDPARERLKRDLFQFNKTVEHGFPHQPSALGYSPSLRILAIGTRSGAVKLYGAPGVEFMGLHRENNAVVQIHFLPGQCKLATLLDDNSLHLWSLKVRDGVSELQEDESFTLRGPPGAAPSATQITVVLPHSCQELLYLGTESGNVFVVQLPSFRVLEDQTISSDAVLQGLPEEARQRRVFEMVEALQEHPRDSSQILIGYSRGLVIIWDLQRSRVLCHFLSSQQLENVSWQRDGRLIVTCHSDGSHCQWPVSSDTQQPEPLRSSMPYGPFPCKAITKIFWLTTKKGLPFTIFQGGMPRASYGDRHCISVFHNSQQTAFDFTSRVIDFTVLAEVDPSAAFDNPYALVVLAEEELVVIDLQTAGWPQVQPPYLASLHCSAITCSHHVSNIPLKLWERIIAAGSRQNAHFSAMKWPIDGGTTLAPPPPQRDLLLTGHEDGTVRFWDASGVCLRLLFRLSTVRVFLTDTDASESLNAQGEEEWPPLRKVGSFDPYSDDPRLGIQKIFLCKYSGYLAVAGTAGQVLVLELNDEAAEHTVEEVEVDLLQDQEGYRWKGHERLAARSGAVCFEPGFQPFVLVQCQPPAVVTSLALHSEWRLVAFGTSHGFGLFDHHQRRQVFVKCTLHPSDQLALEGPLSRVKSLKKSLRQSFRRMRHSRVSSRKCRPAGAPGEMQTAGITKAERTGLQNMELAPVQRKIEARSAEDSFTGFVRTLYFADTYLRDSSRHCPSLWAGTNGGTVYAFSLRVPPAERRMDEPVWAEQAKEIQLMHRAPVVGILVLDGHSVPLPEPLEVAHDLSKSPDMQGSHQLLVVSEEQFKVFTLPKVSAKLKLKLTALEGSRVRRVGVAHFGSCRVEDYGEHHLAVLTNLGDIQVVSLPLLKPQVRYSCIRREDVSGIASCVFTKYGQGFYLISPSEFERFSLSTKWLVEPRCLVDSSKTRNHSCPSNGNSMGPEKAVGRARNSGSQSDGEEKKPGPVMEHALLNDERVLKEIQSTLEGDRGSYGNWRSHQVAVGCGLSNGGGRS +>XP_004849241.1_PREDICTED:_protein_zer-1_homolog_isoform_X1 +MASDTPESLMSLCTDFCLRNLDGTLGYLLDKETLRLHPDIFLPSEICDRLVNEYVELVNAACTFEPHESFFSLFSDPRSTRLTRIHLREDLVQDQDLEAIRKQDLVELYLTNCEKLSAKSLQTLRSFSHTLVSLSLFGCANIFYEEENPGGCEDECLVNPTCQVLVKDFTFEGFSRLRFLNLGRMIDGVPVESLLRPLSSLAALDLSGIQTSDAAFLSQWKDSLVSLVLYNMDLSDDHIRVIVQLHKLRHLDISRDRLSSYYKFKLTRKVLSLFVQKLGNLMSLDISGHMILENCSISKMDEEAGQTSIEPAKSSIMPFRALKRPLQFLGLFETSLCRLTHIPAYKVSGDKNEEQVLNAIEAYTEHRPEITSRAINLLFDIARIERCNQLLRALKLVITALKCHKYDKNIQVTGSAALFYLTNSEYRSEQSVKLRRQVIQVVLNGMESYQEVTVQRNCCLTLCNFSIPEELEFQYRRVNELLLSILNPTRQDESIQRIAVHLCNALVCQVDNDHKEAVGKMGFVVTMLKLIQKKLLDKICDQVMEFSWSALWNITDETPDNCEMFLNFNGMKLFLDCLKEFPEKQELHRNMLGLLGNVAEVKELRPQLMTSQFISVFSNLLESKADGIEVSYNACGVLSHIMFDGPEAWGVCEPQREEVEERMWAAIQSWDINSRRNINYRSFEPILRLLPQGISPVSQHWATWALYNLVSVYPDKYCPLLIKEGGMPLLRDVIKMATARQETKEMARKVIEHCSNFKEENMDTSR +>XP_004838069.1_PREDICTED:_alpha-fetoprotein +MKWLVSLILIFLLRFTDSRTLHKNAYGIASTLDSSQCSSEMNLADIATIFFAQFVQEATYEEVSKMVTDLLTVVKKPTGSEQPAECFENRLSAFLEEICHERAIAGKYGLADCCAHSEEERHKCFLARKKAATVSIPPLQAPDVVTSCKVYEENREMFINKYIYEVSRRHPFLYTPTALSLAARYDKIFPSCCKAENAAECFQTQATSITKDLSESSLLNQHVCAIIRNFGPRNFQAVTITKLSQKFPKANFSEIQKLVLDVAHIHEECCHGNVLECLHDGEKIMSYICSKQDTLSSKIAECCKLPLLELGHCIIHAENDDKPEGLSSDLSKFLGDRDFGRFSPGEKTMFLASFIHEYSRRHTELAVSIILRVANGYQELLEKCFQSENTLECQNKGEQELQKYVQESQTMATRSCSLFQKLGEYYLQNAFLIAYTKKAPQLTSSELMAFTRKMVTTAATCCQLSGDKQLACGEGAADLIIGQLCIRHDASPVNPGVGICCNSSYANRRPCFSSLVVDETYVSPPFSADKFIFHKDLCQAHGVALQEMKQELLINLVKQKVQITEGQLETIIQDFSGFLEKCCHHQEQEACFAEEGPKLISKTRTSLGV +>XP_004862098.1_PREDICTED:_hematopoietic_progenitor_cell_antigen_CD34_isoform_X2 +MLLRGMPWGCAALCLLSLLPSGFTNVSPTADTTETSTLKVSSPVPTSGSHQETTEPVVPGITSPHPVSVDTMETTAAVSETTVNFTSTSGTTLFPESTNSSIQSQTSPDTWASSTPVVTTTGNTSTSNVTSEPSTAPVSVLDYSSTGTSPVATSPTELYTSSSPAPSMVQGEIKCAGIKEVKLTHSICLELNKTASCEDFKQDKGEGLVRVLCGGEAGAQAEAATCSLLLAQSEVKPQCLLLVLANSTELSRKLDLLQKHQPDLEKLGIQSYMEQDVGSHQSYSRKTLIALVTSGILLAILGTTGYFLMNRRSWSPTGERLELEP +>XP_004838963.1_PREDICTED:_transcription_factor_7-like_2_isoform_X17 +MPQLNGGGGDDLGANDELISFKDEGEQEEKSSENSSAERDLADVKSSLVNESETNQNSSSDSEAERRPPPRSESFRDKSRESLEEAAKRQDGGLFKGPPYPGYPFIMIPDLTSPYLPNGSLSPTARTYLQMKWPLLDVQAGSLQSRQALKDARSPSPAHIVSNKVPVVQHPHHVHPLTPLITYSNEHFTPGNPPPHLPADVDPKTGIPRPPHPPDISPYYPLSPGTVGQIPHPLGWLVPQQGQPVYPITTGGFRHPYPTALTVNASMSRFPPHMVPPHHTLHTTGIPHPAIVTPTVKQESSQSDVGSLHSSKHQDSKKEEEKKKPHIKKPLNAFMLYMKEMRAKVVAECTLKESAAINQILGRRWHALSREEQAKYYELARKERQLHMQLYPGWSARDNYGKKKKRKRDKQPGETNDANTPKKCRALFGLDRQTLWCKPCRRKKKCVRYIQGEGSCLSPPSSDGSLLDSPPPSPHLLGSPPRDAKSQTEQTQPLSLSLKPDPLAHLAMMPPPPALLLAEAAHGKASALCPNGALDLPPAAPSSSLAQPSTSSLHSHNSLAGPQPQPLSLVTKSLE +>XP_004870120.1_PREDICTED:_serine/threonine-protein_kinase_WNK2_isoform_X6 +MDGDGGGRDAPGALMEAGRGAGPAGMAEPRVKATRPGPQRFLRRSVVESDQEEPPGLEAAEAAPAQPPQPLQRRVLLLCKTRRLIAERARGRPTAPAPAAPASQPGAPLDPGPEPAGEQEPSPDPVVAAAAAEAPDCGPREEEEGAAAAKQEDDGATEAKPEPGRARKDEPEEEDDDEDDLKAVATSLDGRFLKFDIELGRGSFKTVYKGLDTETWVEVAWCELQDRKLTKLERQRFKEEAEMLKGLQHPNIVRFYDFWESSAKGKRCIVLVTELMTSGTLKTYLKRFKVMKPKVLRSWCRQILKGLMFLHTRTPPIIHRDLKCDNIFITGPTGSVKIGDLGLATLKRASFAKSVIGTPEFMAPEMYEEHYDESVDVYAFGMCMLEMATSEYPYSECQNAAQIYRKVTCGIKPASFEKVHDPEIKEIIGECICKNKEERYEIKDLLSHAFFAEDTGVRVELAEEDHGRKSTIALRLWVEDPKKLKGKPKDNGAIEFTFDLEKETPDEVAQEMIDSGFFHESDVKIVAKSIRDRVALIQWRRERIWPALQSQEPRDSGSPDKARGPPAPLQVQVTYHGQAGQPGPPEPEEPEADQHLLPATLPTSATSLASDSTFDSGQGSTVYSDSQSSQQSMVLGSLVDATPSLVPCVCSPPVSEGPGLAHSLPSLGAFQQPAATPSLSVGSIPAPTHPPLLQQHFPEPMMSFAPVLPPPSAPVPAGPGHPVPPAQQPPPMAQPPALPQVLAQQPLGAVQPVPPHLPPYLAPASQVVAPTQLKPLQMPQPPLQALAQVPPQMPTMPVVPPITPLGAIDGLPQALTDLPAANVAPVPPPQYFSPSVILPNLTTPLPASPALPLQAVKLPHPTGAPLGMPCQTIVPNAPATIPLLAVAPQGMAALSIHPGVAQLPAQLPTQLPAQLPAQPVYPAAFPQMVPGDIPPSPHHTVQSLRATPLQPGPPVPTVPPMPTMPPVPTPTPQPLLPSVTHLPEQVAPAAAATGSQVLLGHLPPYTVDVAVPVPAVPLPPAVLSPPLPDVLPPAAPELLPKFPSSLAPAVVAAPQSVTTQTSALLQPAVLPLPAGPLIPGPCPAVQLMVEPAQEEQASQDKPPGPLQSCESFGGSDVTSGKELSDGCEGAFGGGRLEGRAARRHHRRSTRARSRQERTARPRLTILNVCNTGDKMVECQLETHNHKMVTFKFDLDGDAPDEIATYMVEHDFILPAERETFIEQMKDVMDKAEDMLSEDTDADQGSDAGASPPPLGTCGLVEGEEGRQSPANAPVYQQNVLHTGKRWFIICPVAEHPAADVPESSPPLPVSSLKPEASQDPALYTDQFLKEQPSFPAGQQLLSQADPSDPPGGTPAPLAPPSSPVTVVPQDAAAPASTVPEPAAGTAIQAEGPGTSQGPASEHETTQPLAETHDTQHATQPLSTGQGPSTLPPKVSSCPTGLGEPSSNREISTPGEPLPAVVPGPCPPGGPLQPAVGQPPPPLPTAVGAIGLAVPQLPSPPLGPATTPPPPLALESDGEGPPPRVGFVDNTIKSLDEKLRTLLYQEHVPTSSASAGTPVEAGDRDFSLEPPRGDGPHREALGADLTRPPQPSLEKSETTPAGWGPVEQEQEQGASSPMTAESSSSNTLGCDSDGQVASDPPAPPSAPKAVPASASPACIQPTGQKGRVPREASEEPTQSHLGIVTEGGQLSCPQTHGTRTSGSSRKRPGQQEGSSPAKTVGRFSVVSSQDEWTLASPHSLRYSAPPDVYLDELPSTPDVKLAVRRVQTASSIEVGVGEPASSDSGDECLRRRPPVQKQSSLPSAGAVASDLVKKATAFLHRSSRAGSLDPETPSRASVKVPTISVTSFHSQSSYISSDNDSEFEDADIKKELRSLREKHLKEISELQSQQKQEIEALYCRLGKPLPPNVGFFHTAPPTGRRRKTSKGKLKAGKLLNPLVQQLKVVASSTGSALKRLCLGKEHSSRSSTSSLAPGPEPGPQPTLHIQTQVNNSNNKKGTFTDDLHKLVDEWTTNTAGAAQLKPTLNQLKQTQKLHGMETPGEARAMTIPRVGVAMPYLAPAPGPLSTAAIPGAILALPVPTPGTAHASLPSPPCARLLGQYGGLCPAPVPWGPWEAQGSPPGVWGTWNPAQVPVLPVFLRPPAVSTPSHQLHIT +>XP_004860390.1_PREDICTED:_sonic_hedgehog_protein +MGEMLLPARCLLLVLVSSLLVCSGLACGPGRGFGKRRHPKKLSPLAYKQFIPNVAEKTLGASGRYEGKISRSSERFKELTPNYNPDIIFKDEENTGADRLMTQRCKDKLNALAISVMNQWPGVKLRVTEGWDEDGHHSEESLHYEGRAVDITTSDRDRSKYGMLARLAVEAGFDWVYYESKAHIHCSVKAENSVAAKSGGCFPGSATVHLEQGGTKLVKDLRPGDRVLAADDQGRLLYSDFLTFLDRDDGAKKVFYVIETQEPRERLLLTAAHLLFLAPPQNNSATGELEAAAGGALGRRALFASRVRPGQRVYVVAERDGDRRLLPAAVHSVTLREEAAGAYAPLTAQGTILINRVLASCYAVIEEHSWAHRAFAPFRLAHALLAALSPARTDRGDGGGGGGGGGRVPQPVPGAAEGVHWYSRLLYRIGTWLLDGETLHPLGMAVASS +>XP_004861831.1_PREDICTED:_pre-mRNA-splicing_factor_18_isoform_X2 +MDVLKSEILRKRQLVEDRNLLVENKKYFKRSELAKKEEEAYFERCGYKIQPKEEDQKPLTSSNPVLELELAEEKLPMTLSRQEVIRRLRERGEPIRLFGETDYDAFQRLRKIEILTPEVNKGLRNDLKAALDKIDQQYLNEIVGGQEPGEEDTQNDLKVHEENTTIEELEALGESLGKGNDHKDMDIITKFLKFLLGVWAKELNAREDYVKRSVQGKLNSATQKQTESYLRPLFRKLRKRNLPADIKESITDIIKFMLQREYVKANDAYLQMAIGNAPWPIGVTMVGIHARTGREKIFSKHVAHVLNDETQRKYIQGLKRLMTICQKHFPTDPSKCVEYNAL +>XP_004841050.1_PREDICTED:_calcium-responsive_transactivator +MSVAFASARPRAKGEVTQQTIQKMLDENHHLIQCILDYQSKGKTAECTQYQQILHRNLVYLATIADSNQNMQSLLPAPPTQNMNLGPGGLSQSGSSQGLHPQGSLSDAISTGLPPASLMQGQIGNGPNHVSMQQTAQSTLPTTSMSMSGSGHGTAPGYSHSGPASQSVPMQGQGAIGNYVSRTNINMQSNPVSMMHQQAATSHYNSAQGGSQHYQGQSSIAMMGQGGQGSSMMGQRPMAPYRASQQGSSQQYLGQEEYYSEQYSHSQGASEPMSQQYYPDGHGDYAYQQSSYTEQSYDRSFEESTQHYYEGGNSQYSQQQAGYQQGTAQQQAYPQQQYPSQQSYPGQQQGYGPAQGAPSQYSSYQQGQGQQYGSYRASQSGPSAQQQRPYGYEQGQYGNYQQ +>XP_004871542.1_PREDICTED:_bcl-2-associated_transcription_factor_1_isoform_X1 +MGRSNSRSHSSRSKSRSQSSSRSRSRSHSRKKRYSSRSRSRTYSRSRSRDRIYSRDYRRDYRNNRGMRRPYGYRGRGRGYYQGGGGRYHRGGYRPVWNRRHSRSPRRGRSRSRSPKRRSVSSQRSRSRSRRSYRSSRSPRSSSSRSSSPYSKSPVSKRRGSQEKQTKKPEGEPQEESPLKSKSQEEPKDTFEHDPSESIDEFNKSATSGDIWPGLSAYDNSPRSPHSPSPIATPPSQSSSCSDAPMLSTVHSAKNTPSQHSHSIQHSPERSGSGSIGNGSSRYSPSQNSPIHHIPSRRSPAKTIIPQNAPRDESRGRSFYPDGGDQETAKTGKFLKRFTDEESRVFLLDRGNTRDKEAPKEKGSEKGRAEGEWEDQEALDYFSDKESGKQKFNDSEGDDTEETEDYRQFRKSVLADQGKNFAAASHRNTEEEGSKYKSKVSLKGNRESDGFREEKNYKLKETGYVVERPSTTKDKHKEEDKSSERITVKKETQSPEQVKSEKLKDLFDYSPPLHKNLDAREKSTFREESPLRIKMIASDSHRPEVKLKMAPVPLDDSNRPASLTKDRLLASTLVHSVKKEQEFRSIFDHIKLPQASKSTSESFIQHIVSLVHHVKEQYFKSPAVTLNERFTSYQKATEEHSTRQKSPEIHRRIDISPSALRKHTRLAGEERVFKEESQKGDKKLRCDSADLRHDIDRRRKERSKERGDSKGSRESSGSRKQDKTPKDYKEYKSYKDDSKHKSREQDHSRSSSSSASPSSPSSREEKESKKEREEEFKTHHELKEYSGFAGVSRPRGTFFRIRGRGRARGVFAGTNTGPNNSNTSFQKRPKEEEWDPEYTPKSKKYFLHDDRDDGVDYWAKRGRGRGTFQRGRGRFNFKKSGSSPKWTHDKYQGDGIVEDEEETMDNNEDKKDRRKEEKE +>XP_012933865.1_PREDICTED:_FERM_domain-containing_protein_5_isoform_X5 +MCFRVKFYPADPAALKEEITRYLVFLQIKRDLYHGRLLCKTSDAALLAAYILQAEIGDYDPGKHPEGYSSKFQFFPKHSEKLERKIAEIHKTELSGQTPATSELNFLRKAQTLETYGVDPHPCKDVSGNAAFLAFTPFGFVVLQGNKRVHFIKWNEVTKLKFEGKTFYLYVSQKEEKKIILTYFAPTPEACKHLWKCGIENQAFYKLEKSSQVRTVSSSNLFFKGSRFRYSGRVAKEVMESSAKIKREPPEIHRAGMVPSRSCPSITHGPRLSSVPRTRRRAVHISIMEGLESLRDSAHSTPVRSSSHGDNFLPHVRSSRADSNERVAVISDEAYSPADSVLPTPVAEHSLELMLLSRQINGATCSIEEEKESEASTPTTTEAETLGRELRALCQGHGRPEEEQVNKFVLSVLRLLLVTMGLLFVLLLLLIILTESDLDIAFFRDIRQTPEFEQFHYQYFCPLRRWFACKIRSVVSLLIDT +>XP_004865828.1_PREDICTED:_zinc_finger_and_BTB_domain-containing_protein_7A_isoform_X1 +MLSDLPSLPQVSVRKMAGGVDGPIGIPFPDHSSDILSGLNEQRTQGLLCDVVILVEGREFPTHRSVLAACSQYFKKLFTSGAVVDQQNVYEIDFVSAEALTALMDFAYTATLTVSTANVGDILSAARLLEIPAVSHVCADLLDRQILAADAGGDSGQLDLVDQADQRNLLRAKEYLEFFQSNPMNSLPPTAAANFPWSAFGASDDDLDATKEAVAAAVAAVAAGDCNGLDFYGPGPPAERAPVGDGDEGDSNPGLWPEQDEDAPTTAGGLFQPPVAPPAATQNGHYGRAGEEEAASLSEAAPEPGDSPGFLSGAAEGEDGDAGDVDGLAASTLLQQMMSSVGRAGALAGGDSDEESRADDKGVMDYYLKYFSGAHEGDVYPAWSQKGEKKIRAKAFQKCPICEKVIQGAGKLPRHIRTHTGEKPYECNICKVRFTRQDKLKVHMRKHTGEKPYLCQQCGAAFAHNYDLKNHMRVHTGLRPYQCDSCCKTFVRSDHLHRHLKKDGCNGVPSRRGRKPRVRGGAPDPTLGTGVPPPGAPSSAPPGSPDTATAAATTTRRNGQEKHFKDQEEDEEATSPDGSSGRLNVAGASGGDDSGGGPGATADGNFTAGLA +>XP_012927228.1_PREDICTED:_MAP_kinase-activated_protein_kinase_5_isoform_X5 +MLFCLTTCCPRGRVCVKKCTQERFALKILLDRPKARNEVRLHMMCATHPNIVQIIEVFANSVQFPHESSPRARLLIVMEMMEGGELFHRISQHRHFTEKQASQVTKQISLALQHCHLLNIAHRDLKPENLLFKDNSLDAPVKLCDFGFAKIDQGDLMTPQFTPYYVAPQVLEAQRRHQKEKSGIIPTSPTPYTYNKSCDLWSLGVIIYVMLCGYPPFYSKHHSRTIPKDMRRKIMTGSFEFPEEEWSQISEMAKDVVRKLLKVKPEERLTIEGVLDHPWLNSTEALDNVLPSAQLMMDKAVVAGIQQAHAEQLANMRIQDLKVSLKPLHSVNNPILRKRKLLGTKPKDGVYIHDHENGAEDSNVALEKLRDVIAQCILPQAGKGENEDEKLNEVMLEAWKYNRECKLLRDTLQSFSWNVSGHGFTDKVDRLKLAEIVKQVIEEQTTSHESQ +>XP_004838078.1_PREDICTED:_proton-coupled_amino_acid_transporter_4 +MEAAPAAADEAGLEELDMDVMRPLINEQNFDGSSDEEHEAELLPVQKHYQLDDQEGISFVQTLMHLLKGNIGTGLLGLPLAIKNAGIVLGPISLVFIGIISVHCMHILVRCSHFLCQRFKKSTLGYSDTVSFAMEVSPWSCLQKQAAWGRTVVDFFLVITQLGFCSVYIVFLAENVKQIHEGFLESKVFVSNSTNSSNPCERRSVDLRIYMLCFLPFIILLVFIRELKNLFVLSFLANVSMAVSLVIIYQYVVRNMPDPHNLPIVAGWKKYPLFFGTAVFAFEGIGVVLPLENQMKESKRFPQALNIGMGIVTALYVTLATLGYMCFRDEIKGSITLNLPQDVWLYQSVKILYSFGIFVTYSIQFYVPAEIIIPGVISKFHAKGKQICEFGIRSFLVSITCAGAILIPRLDIVISFVGAVSSSTLALILPPLVEILTFSKEHYNIWMILKNISIAFTGVVGFLLGTYVTVEEIVYPTPRVITGTSQSPSLNWNSTCLTSGLK +>XP_004852360.1_PREDICTED:_E3_ubiquitin-protein_ligase_pellino_homolog_3_isoform_X2 +MVLEGNPEVGSPRTSDLQHTGNKGSCLLSSPGEGAQPGEELIKYGELIVLGYNGCLASGDKGRRRSRLALSRRPHANGVKPDVMHHISTPLISKALSNRGQHSISYTLSRSHSVIVEYTHDSDTDMFQIGRSTENMIDFVVTDTSPGGSAAEGPSAQSTISRYACRILCDRRPPYTARIYAAGFDASSNIFLGERAAKWRTPDGLMDGLTTNGVLVMHPAGGFSEDSAPGVWREISVCGNVYTLRDSRSAQQRGKLVENESNVLQDGSLIDLCGATLLWRTPAGLLRAPTLKQLEAQRQEANAARPQCPVGLSTLAFPSPARGRTAPDKQQPWVYVRCGHVHGYHGWGCRRERGPQERECPLCRLVGPYVPLWLGQEAGLCLDPGPPSHAFAPCGHVCSEKTARYWAQTPLPHGTHAFHAACPFCGAWLTGEHGCVRLIFQGPLD +>XP_004872256.1_PREDICTED:_cytosolic_5'-nucleotidase_3A_isoform_X2 +MTNQESAVHMKMMPEFQRSSVRIKNPTRVEEIICGLIKGGAAKLQIITDFDMTLSRFSYKGKRCPTCHNVIDNCKLVTDECRKKLLQLKEQYYAIEVDPVLTVEEKYPHMVEWYTKSHGLLVEQGIPKAKLKEIVAESDVMLKEGYENFFDKLQQHSIPVFIFSAGIGDVLEEVIRQAGVYHPNVKVVSNFMDFDENGMLKGFKGELIHVFNKHDGALKNTDYFSQLKDNSNIILLGDSQGDLRMADGVANVEHILKIGYLNDRVDELLEKYMDAYDIVLVKDESLEVANSILQKVL +>XP_004847251.1_PREDICTED:_zinc_finger_CCHC_domain-containing_protein_4_isoform_X1 +MAAPRYGRESVEAEPGAGSQGTSGVEMVLLSDPASPAPLCPHGPTLLFVKMSQGKEETRRFYACSACRDRKDCNFFQWEDEKLSGARLTAREAHNQRCRPPLSRMQCVQRYLRFIQLPLTERKFCCSCQQLLLPDEWGEHREHQVVGDVSVTQLRRPSQLLYPLENKKTNAQYLFADRTCQFLVGLLSALGFRRVLCVGTPRLHELIRLTASGDKKSNLKSLLLDIDFRYSQFYMEDSFCHYNMFNHHFFDGKPALEVCRAFLQEDKGEGVIMVTDPPFGGLVEPLAVTFKKLITVWKEGQVQDDSHQEMPIFWIFPYFFEARICHFFPSFCMLDYQVDYDNHALYKHGKTGRKQSPVRIFTNIPPNKITLPTEEGYRFCPPCQRYVSLENQHCEHCNSCTSKDGRKWKHCFLCKKCVKPSWIHCSICNHCAVAGHSCEGPKDGCFICGELGHKRSSCPNISTSKEANKAVRNQKQRKSNKMKMETTKGQSMNHTSVTRKKKKRERAHQYLCS +>XP_004854508.1_PREDICTED:_glutaredoxin-like_protein_C5orf63_homolog +MLWFQGNSMQLVKSSFVLFLRNLSALKTTLPVLTLFTKDPCPLCDEAKELLKPYKNRFILQEVDITLPENSAWYERYKFDIPVFHLNGRFLMMHRVNISKLEKQLLKLEQQGAGC +>XP_012929753.1_PREDICTED:_lysosomal_amino_acid_transporter_1_homolog_isoform_X4 +MLWRKLGASNFSSCPNGSILWIWDVFHECVQDGWDKASVSLGLISILCFAASTFPQYIKACKTGNMDQALSVWFLLGWIGGDSCNLIGSFLADQLPLQSYTAVYYVLADLVMLTLYFHYKFKKRPSLLSAPINSVLLFISGTVCITPLLSSTGPVAAPREAFQGRMLLSVEPGNKPFTKQEIIGFVVGSVSSVLYLLSRLPQIRTNFLRKSTQGISYSLFALVMLGNALYGLSVLLKNPEVGQSEGSYMLHHLPWLVGSLGVLLLDTIISIQFLVYRDVIEAASLEREPLLSSCAGPE +>XP_004849923.1_PREDICTED:_rab11_family-interacting_protein_5_isoform_X3 +MALVRDAEPASGPSRWLPTHVQVTVLRARGLRGKSSGVGSTSDAYTVIQVGREKYSTSVVEKTQGCPEWREECSFELPPGALDGLLRAQEADAGPAPWASGSAAACQLVLTTMHRSLIGVDKFLGQATVALDEVFGAGRAQHTQWYKLHSKAGKKEKERGEIQVTIQFTRNNLSASMFDLSIKDKPQSPFSKLKDKMKGKKKYDLESASAILPSSALEDPELGSLGKMGKAKGFFLRNKLRKSSLTQSNTSLGSDSTLSSASGSLAYQGPGAELLTRSPSRSSWLSSEGGRDSIQSPKLLTHKRTYSDEASQLRAAPTRALLDLQGHLDAGPRSSLCVNGSHIYNEEPQAPARHRSSISGPFPPSSSLHSVSSRPSEEGSRSSDDSWGRGSRGAGSSSEVVPGPEELSTQAKAQAREERAQTPEGKPVQVATPILVSSEAVVEKEGARKEERKPRMGLFHHHHQGLSWSELGRRGSIGEKGGPTVGASPQHLSSGEDKAKSSWFGLRESKESSQKPSPHPVKPLSATPVEGSPDRKQPRSSLSTALSSGLEKLKTVTSGSIQPVAPAPQLGQTVDTKKLKDSAVPDQSAKYYHLTHDELIGLLLQRERELSQRDEHVQELESYIDRLLVRIMETSPTLLQIPPGPPK +>XP_012933928.1_PREDICTED:_FERM_domain-containing_protein_4A_isoform_X5 +MVLQAAVAPNGAQRRLLKIPCGSLRRRSVERMTEGRRCQVHLLDDRKLELLVQPKLLAKELLDLVASHFNLKEKEYFGIAFTDETGHLNWLQLDRRVLEHDFPKKSGPVVLYFCVRFYIESISYLKDNATIELFFLNAKSCIYKELIDVDSEVVFELASYILQEAKGDFSSNEVVRSDLKKLPALPTQALKEHPSLAYCEDRVIEHYKKLNGQTRGQAIVNYMSIVESLPTYGVHYYAVKDKQGIPWWLGLSYKGIFQYDYHDKVKPRKIFQWRQLENLYFREKKFSVEVHDPRRASVTRRTFGHSGIAVHTWYACAALIKSIWAMAISQHQFYLDRKQSKSKIHAARSLSEIAIDLTETGTLKTSKLANMGSKGKIISGSSGSLLSSGSQESDSSQSAKKDMLAALKSRQEALEETLRQRLEELKRLCLREAELTGRLPVEYPLDPGEEPPTVRRRIGTAFKLDEQKVLPKGEEAELERLEREFAIQSQITEAARRLASDPNVSKKLKKQRKTSYLNALKKLQETENAINEHRIKSGKKPTQRASLVIDDGNIASEDSSLSDALVLDDEDPAVTSAMSPLQSPHKGLPPRPPALHRPAPPQSLEGLRQMHFHRGDYDKSPVKPKMWSESSLDEPYEKAKRRSPHGHAQAGSHKRFPSTGSCAEAGGASPLQSSPVRGLLHWNSQSSMPSTPDLRVRSPHYVHSTRHRSSSLESQGKLLGSENDTGSPDFYTPRTRSSNGSDPMDDCSSCTSHSSSEHYYPAQANANYSTLAEDSPSKARQRRRQRQRAAGLLGAAPSGSMPDLARGAAGGVYLHSQSQPGSQYRIKEYPLYVEGGAPVVVRSLESDQEGHYSVKAQFKTSSSYTAGGLFREGDAGRLTPSRSQILRTPSLGREGAQDRGRAAVSDELRQWFQRSSAAQREPGRLSHASSASSDSGSQHSASPQSTFVAHSRVTRMPQMCKATSAALPQSQRSSTPSSEVGATPPSSPHHALAWQTGSYSDSCFPDSSLYPELADVQWYGQEKAKPGTLV +>XP_004845632.1_PREDICTED:_TGF-beta-activated_kinase_1_and_MAP3K7-binding_protein_1_isoform_X1 +MAAQRRSLLQSEQQPSWTDDLPLCHLSGVGSASNRSYSADGKSTESHPPEDSWLKFRSENNCFLYGVFNGYDGNRVTNFVAQRLSAELLLGQLNAEHTEADVRRVLLQAFDVVERSFLESIDDALAEKASLQSQLPEGVPQHQLPPQYQKILERLKVLEREISGGAMAVVAVLLNNKLYVANVGTNRALLCKSTVDGLQVTQLNMDHTTENEDELFRLSQLGLDTGKIKQVGIICGQESTRRIGDYKVKYGYTDIDLLSAAKSKPIIAEPEIHGAQPLDGVTGFLVLMSEGLYKALEAAHGPGQANQEIAAMIDTEFAKQTSMDAVAQAVVDRVKRIHGDTFASGGERAKFCLRHEDMTLLVRNFGYPLGEMSQPTPSPASAAGGRVYPVSVPYSSTQSTSKTSVTLSLVMPSQGQMVNGAHSASTLDEATPTLTNQSPTLTLQSTNTHTQSSSSSSDGGLFRARPAHSLPPGEDGRVEPYVDFAEFYRLWSVDHGEQSVMTAP +>XP_004856843.1_PREDICTED:_NLR_family_member_X1_isoform_X1 +MRWGLHLSRASWGSGLGRIPRPPDRIPFLMHWSWPPKGEHPLGPLRAFVRYHRSSADTAPPPGRHGQLFQSTSAAGKGLEAIHLHRQNLAEWFSRLPREERQFGPTFALDTVHVDPVIRESTPDELLRPSSGLALDHQSPSAGLPPLALSQLFNLDACGRRVQTVVLYGTVGTGKSTLVRKMVLDWCYGRLPTFKLVIPFSCEDLSSLGPAPASLCQLVAQRYPPLKEILTLMPAAGPRLLFVLHGLERLNLDFRLAGTALCSDLKEPAAPAAIIVNLLRKYMLPEASILVTTRPSAIGRIPSKYVGRYGEICGFSDTNLQKLYFQLRLNQPDCGHSAGFSATPAQRDHLVQMLSRNLEGHHQIAAACFLPSYCWLVCATLHFLHAPTPAGQTLTSIYTSFLRLNFSGETLDSTDPSNLSLMAYAARTMGKLAYEGVSSRKTYFSEEDVRGCLEAGIKTEEEFQLLHVFHRDALRFFLAPCVEPGHRGTFVFTVPAMQEYLAALYIVLGLRKTTLQRVGKEAAELMGRVGEDVSLVLGIVAKLLPLRILPLLFNLLKVVPQVFGRLVGKSREAVAQAMVLEMFREEDYYNDDVLDQMGASILGVEGPRRHPDEPPEDEVFELFPMFMGGLLSAHNRAVLAQLGCPIKNLDALENAQAIKKKLGKLGQQVLPPSELLDHLFFHYEFQNQRFSNELLSSLRQLNLAGVRMTPLKCTVVAAVLGSGRHVLDEVNFASCQLDPAGLRTLMPVFLRARKLGLQLNSLGPEACRDLRDLLLHDHCQITTLRLSNNPLTAAGVALLLEGLKGNTSLTHLSLLHTGLGDEGLELLAAQLDHNHQLQELNVAYNGAGDKAALALAKAAWEHPSLELLHLYFNELSSEGRQVLRDLGGTAEGGTRVVASLTEGAVVSEYWSMILSEVQRNLNSWDWTRVRRHLELLLRDLEDNRGATLNPWRKAQLLRVEGEVKALLEQLGGPGS +>XP_012924884.1_PREDICTED:_transmembrane_protein_adipocyte-associated_1_isoform_X3 +MLFLAQGWDKCWSSCSAPSKRFRKPGKAWGGGTNHPRPGDPRLRSQHVRAVPGDPVPDGPPKPKSRLEAERRRPRSRLLTASRGWKVPRRSQGALLERGRDPGHFLGPAAGWMDTPEWVMGANRSTAVPLPGAPNISVPHRCLLLLYEDVGTSRVWYWDLLLLIPNVLFFVFLLWKLPFARAKIRLSSSPIFITFYILGEPDFSLRGGPGAWDKVFVVALVGIARAVVSMTVSTSSATMVADKILWEITRFFLLAIKLSVVILGLAFGHLESKSSIKRVLAITTVLSLTYSVTQVRGGSQGTLEILYPDAHLSAEDFNIYGHGGRQFWLVSSCFFFLVYSLVVVLPKTPLKERISLPSRRSFYVYAGILALLNLVQGLGSALLCANIIEGLCCVDATTFLYFSFFAFAPLIYVAFLRSFFGSEPKILFSYKCQVDQTEEPDMHLPQPYAVAGREGMEASGATSTQFASGGVAYLDDVASMPCHTGSINSTDSERRKTINA +>XP_004849365.1_PREDICTED:_cyclin-dependent_kinase_9_isoform_X2 +MAKQYDSVECPFCDEVTKYEKLAKIGQGTFGEVFKAKHRKTGQKVALKKVLMENEKEGFPITALREIKILQLLKHENVVNLIEICRTKASPYNRCKGSIYLVFDFCEHDLAGLLSNVLVKFTLSEIKRVMQMLLNGLYYIHRNKILHRDMKAANVLITRDGVLKLADFGLARAFSLAKNTQPNRYTNRVVTLWYRPPELLLGERDYGPPIDLWGAGCIMAEMWTRSPIMQGNTEQHQLALISQLCGSITPEVWPNVDKYELFEKLDLVKGQKRKVKDRLKAYVRDPYALDLIDKLLVLDPAQRIDSDDALNHDFFWSDPMPSDLKGMLSTHLTSMFEYLAPPRRKGSQITQQTTNQSRNPAATNQTEFERVF +>XP_012924145.1_PREDICTED:_BRISC_and_BRCA1-A_complex_member_1_isoform_X1 +MEVAEPGSPTEEEEEEEEEEEEEEEEEQSAEPRPQTRSNPEGAEDRALGAQASVGSRSEGEGEAASVGDGTPNPPGAGPQPWQVPPSALEVQIRTPRVNCPEKVIICLDLSEEMSLPKLESFNGSKTNALNVSQKMIEMFVRTKHKIDKSHEFALVVVNDDTAWLSGLTSDPRELCSCLYDLETATCSTFNLEGLFSLILQKTELPVTESVQTIPPPYVVRSILLYSRPPRQPQFSLTEPMKKMFQCPYFFFDVVYIHNGAEEKEEELSWKCSSHDRAAGPQVGHLYLYEQGQRRPAPTHTSMPSSKDPPLQCLSSSSEKIIMGLEMRPSGVPALGHVCLHGQPGYQGHQLQV +>XP_004872926.1_PREDICTED:_transmembrane_protein_171_isoform_X3 +MSSIAIAEPDGDEQDRGASKLIFFLFVFGAVLLCVGLLLSIFGYQACQYEPLPDCNMVLKIAGPSCAVIGLGAVILARSRARLQLLVRRRQGNQVDSDQAFLCGESRQFAQCLIFGFLFLTSGLLVSILGIWVPGCSSDWAQDLLNETDTISAEPQICGFLSLQIMGPLIVLMGLCFFVVAHVKKKNNLSVSQDASESEEGHGPSTEPVQVTVGDSVIIFPPPPPPYFPESSTSAGSQSPGANSLLPTDSPPPYFSLFSHGRTSALENQDTAHEQEHEFVYTISGPHSPPEITHAPRVLLELPPRYEEKETPTATSLSLPSELSAP +>XP_004835810.1_PREDICTED:_nectin-3_isoform_X1 +MASAPLSPGGSKAQLSSASPLAAGLLLPAPTPTPLLLLLFPLLLLSRLCGALAGPIIVEPHITAVWGKNVSLKCLIEVNETITQISWEKIQGTSTQTVAVHHPQYGFSVQGEYQGRVSFKNYSLNDATITLHNIEFSDSGKYICKAVTFPLGNAQSSTTITVLVEPTVSLMKGLDSLIDGGNETVAAICTAATGKPVAHIDWEGDLGEKESSTVSFPNETATIISRYKLFPTRFARGRRITCVVKHPALEKDIRYSFVLDIQYAPEVSVTGYDGNWFVGRKGVNLKCNADANPPPFKSVWSRLDGQWPDGLLASDNTLHFVHPLTFNYSGVYVCKVTNSLGQRSDQKVIYISDPPTTTTLQPTIHWHPSTADIEDLATEPKKLPFPLSTLATIKDDTVGTIIASVVGGALFIVLVSVLAGIFCYRRRRTFRGDYFAKNYIPPSDMQKESQIDVLQQDELDSYPDSVKKENKNPVNNLIRKDYLEEPEKAQWNNIENLNRFERPVGYYEDLKMGMKFVSDEHYDENEDDLVSHVDGSVISRREWYV +>XP_004850235.1_PREDICTED:_receptor-binding_cancer_antigen_expressed_on_SiSo_cells +MAITQFRLFKVCTCLAAVFSFLKRLICRSGRGRKLSGDQITLPTTVDYSSVPKQTDVEEWTSWDEDAPTSVKIEGGDGSAATQQNALEQLEPDYFKDMTPTIRKTQKIVIKKREPLNFGNPDGSTGFSSRLAATQDMPFIHQSSELGDLDTWQENTNAWEEEEDAAWQAEEVLRQQKIADREKRAAEQQRKKMEKEAQRLMKKEQNKIGVKLS +>XP_012934280.1_PREDICTED:_cell_adhesion_molecule-related/down-regulated_by_oncogenes_isoform_X2 +MHPDLGPLQTLLYVILTILCSSVVSDLAPYFISEPLSTDQQLGGPVILHCSAKPLTAHISWLHNGKRLGRNVEQIKIHQGTLTILSLNPSLSGYYQCIANNSIGAILSGPATVSIAVLGDFDSSAKHVITAEEKSTGFIGCQVPASNPKAEVRYKIRGRWLKHSTGNYVILPSGNLQILNVSSEDKGVYKCAAYNPITNELKVEPVGQKLLVSRPSSDGFQILHPTLSQALAVLSHSPVTLECVVTGVPASQVYWLKEGQDAVLGSNWRRLYSHLATASIDPADSGNYSCVVGNKSGDIKHVTYMVNVLEHASISKGLQDQRVSLGATVHFTCDVLGNPVPNRTWFHNAQPIHPSPRHLTGGNELKITGVTMEDSGLYQCVADNRIGFMQSTGRLQIEQSNGFKPVIITAPTSAMVSDGDFVMLSCNATGVPVPVIRWYDSRGLITSHPSQVLRSKSRKSHLVRPGGLDPEPVYFIMSRAGSSSLSIQAVTQERAGRYICEAINDYGTTRSEAFLTVVPFETNTKAETLTPDAIQSDERDHRDSSESGLLSSFPGKGHPRAVESSEKNPSGTSVPDAPIILSPPQTHTADTYHLVWRAGKDGGLPINAYFVKYRKLDDGAGAVGSWHTVRVPGSENELQLTELEPSSLYEVLMVARSAAGEGQPAMLTFRTSKEKTASSKNTQASSPPLGIPKHPVVSEATNYNFGVVLTDSSRHSGVPEAPDRPTISTASETSVYVTWIPRANGGSPITAFKVEYKRMRTGDWLVAAEDIPPSKLSVEVRNLEPGSIYKFRVIAVNHYGESFRSSASRPYQVAGFPKRFSSRPITGPHIAYTEAVSDTQIMLKWTYIPSSNNNTPIQGFYIYYRPTDSDNDSDYKRDVVEGSKQWHMIGHLQPETSYDIKMQCFNEGGESEFSNVMICETKVKRVPGASEYPIKDLSTPPNSSGNGGNVGPATSPARSSDMLYLIVGCVLGVMVLILMVFIAMCLWKSRQQNAIQKYDPPRYLYQGSDINGQMVECATLPGTQINGSVHAGFLGNSSLNNGCAHLHHKVPNGVNGMVNGSLTGGLYPAHTNSLTRTHVEFEHPHHLVNGGGMYTAIPQIDPLECVNCRNCRNNNRAGKKKLREAEGDLLSGNCPGFWILASY +>XP_012931436.1_PREDICTED:_coiled-coil_domain-containing_protein_91_isoform_X4 +MPMWNKVSGVHLSPASPEQVLDHDHSSPSVGCLSPDAILSSPENAHTDNSIVSNAVPKAQVQQSTRTHLDIPLFPLGLSVETSDGTVALVDDSEDPAGNVSNIQLQQKVSDLEMKLKMSEEEKQRIKKDVESLMEKHSILEKDFLKEKEQEAISFQDRYKELQEKHKQELEDMRKMGHEALGIIVDEYKALLQSSLKQQVEAIEKQYISAIEKQAHKCEELLNAQHQRLLEMLDREKEMLKEKINEALNQQSQEQKEILKKCLEEERQKHKEALESSAKLEQEAMKEVVMKAIEEERKNLEKAHAEERELWKTEHAKDQENVSQAIETAIQEQRKISQETVKAAIIEEQKQSEKAVEEAVRRTRDELIEYIKEQKRLDQVIRQRSLSSLELFLSCAQKQLSALIATEPIDTE +>XP_004836942.2_PREDICTED:_kinesin_light_chain_1_isoform_X1 +MYDNMSTMVYIKEDKLEKLTQDEIISKTKQVIQGLEALKNEHNSILQSLLETLKCLKKDDESNLVEEKSSMIRKSLEMLELGLSEAQVMMALSNHLNAVESEKQKLRAQVRRLCQENQWLRDELANTQQKLQKSEQSVAQLEEEKKHLEFMNQLKKYDDDTSPSEDKDADSAREPLDDLFPNDEDDPGQGIQQQHSSAAAAAQQGGYEIPARLRTLHNLVIQYASQGRYEVAVPLCKQALEDLEKTSGHDHPDVATMLNILALVYRDQNKYKDAANLLNDALAIREKTLGKDHPAVAATLNNLAVLYGKRGKYKEAEPLCKRALEIREKVLGKDHPDVAKQLNNLALLCQNQGKYEEVEYYYQRALEIYQTKLGPDDPNVAKTKNNLASCYLKQGKFKQAETLYKEILTRAHEREFGSVDDENKPIWMHAEEREECKGKPKDGTSFGEYGGWYKACKVDSPTVTTTLKNLGALYRRQGKFEAAETLEEAAMRSRKQGLDTVHKQRVAEVLNDPESTEKRRSRESLSSDVVKYESGADGGEEVSMSVEWNGDGTGSLKRSGSFSKLRASIRRSSEKLVRKLKGGSSRESEPRNPGASPAEPLCVENDSSSLEDASTN +>XP_004839072.1_PREDICTED:_tudor_domain-containing_protein_1 +MMSRNLEASVCQMTEPNFEKDEVKLPSHDSLRTPGGHHNHPNFRLKSPENGNGNNFLLCEQTRQYLSRQEDNSVSSDAGGINGEVVGSKGNRKTGNSVSPLSVENNSSPREIKPKPTNNVPPVKSKKSHHFVKNSLSINNPALFNSLRLPFRSTTCHRCGLFGSLRCSQCKQTYYCSTACQRRDWSTHSIVCKPVQQNFHKFEENKSPFEMNVEVKNESNCPPGVTKEIAIAAEKIMFSDLKGLHLKKTMEIKGTVTEFKHPGDFYVQLYSSEALKHMNQLSASLKETYANMVHEEDYIPIKGEVCVAKYTVDQTWNRVMIQDVDELQKTAQVLYIDYGNKEIIPVNRIHQLNRNIELFPPSAIKCFVAGVTPAEGTWSDDCIKTIKSLLMEQYCSIKIVDILKEELVAYAVDVMLQSSGEFLDHMLVEMGYGLKAKGQNSKKQCTGQSDPADVGMMTAENKIAVDRSDLIPKVLTLNVGDEFCGVVAHIQTPEDFFCQQLQSGRKLAELQTSLSEYCGQVCPRSDFYPTIGDICCAQFSEDDQWYRASVLAYASEESVLVGYVDYGNFEILSLTRLCPIIPKLLELPMQALKCMLAGVKPSLGIWTPEAICLMKKIVQNKMVMVKVVDKLDSSYLVELRDKSVTPVISVAKVLIDAGFAVDEKETVTDKPSVPLSAEGKVNPVEWTWVELAVDQTVDVVVCTMYNPGEFYCHILKEHALEKLSDLNKSLAEYCRQKLHNGFKAEIGQPCCAFFADIQPKNKYWTKEAIARFQMCISGVKLQARVVEITERGVGVELTDLSTSYPRIISDVLISEKLVLKAGSPYKDLPDNRPVNKHNHETFTQGLQAFSSAEQWKTIELPANKTVQASILEIINPNLFYAIPNDMPENQEKLSILTAELLEYCSAQKSQPSCKPRIGDACCAKYTGDDFWYRAVVLETSGSDVKVLYADYGNIETLPLSRVQPITASHLELPFQIIKCSFEGLVELNGSCSQLIIELLKNFMLNQNVMLSVKEIIKNIHTVSVEKCSEHGTVSVPDKLVKYNRAQSITSKNQNALHKEKMHRMNCCCTELQEQVEKHEQILFFLLNNPTNQNKLIEMKKLLKS +>XP_004868449.1_PREDICTED:_RNA-binding_protein_44 +MMQATALVEMASGKGYHSSGENLQKDLSSDSKKSSNACNEVKLTFPDHEWDSLALEPRASVREISNTDTTRLLESSFSENQDTNIQSAHSQSSKFEDSIDYVFMNEIYCIYSESELKNENTTNLNSELDSEIEKREEAFFDILKLQGTRTVALERICEISNADYEETAGEMQKDVIEEDSQQEYHSAEEQEYISNHLSFVQAKTSSISNLEVELRNSGHEVQSASNLEDNPIKLESSSVISSDSLNVVAQEYTPCVSKFQNCDLLKEYYEPKYEKCKEQETSLMYPIVFVQRGNSLGNEESQAKNDFLNPQTALKTKTCTETMKSQISENKDFCGNAVVKNRISQHLENPSTISQDRALETLQESSKVCQTSWSSIFDDSVISAYGCSHYESLQSTPDPALGFAVPPRIAIRDDQTIKEDSSLKAINGNNMNKACSEEDGKGTYPKSVIDAAGCTVTVHQTVDVSTDFRACFTTSRATNARPSVVSTSSNTEVTMMSKKRPSKWQSGKQKSVACNTDWSYGQDGVDTPVAITKGSGKSLSVDSSQPNGNFQNKDSLELKTYDNTDLKKHPDREFQLSEEVEKSSPSQCCKKVMQRLMEAEMHLLNARYEMCRRHCWDIYKLTVENKGLNRNLLSSSAQKELGSALLSISGDLKVRYTNLKEKIHKGIPLEELPLLSVESKLLITFSTFVSRLMKEESHDFSGADSELNDQTASASEVSPSLKETHSQMSSLPDSTSPKKDGLKNGEINVDFSQLKLDDKECRSGHEVSEHWFDAKENMTGVDSSEIQETEIDHDRQNPKLTVEMKNVEPLQRDKGFLIHVGGLCPSVSEADLRSYFQKYQVSEISICDSSTDYRYASLSFKKNSDAKMAVEEMNGMEISGKSVNVWLIETHGECTSPLSSKKHLNNLEKNINKEINPASSVSRLARTRPRQMVSEQDSELSPLDQDAKKNCKQIESAQLPKIPIQFLPPNTLNFRSFTKIIKILAELHPEVSRHHIISALQEVRKNQKGFLKGLSISTIVEMTSSVLKKTASH +>XP_012933645.1_PREDICTED:_fas-binding_factor_1_isoform_X5 +MTLLWSGFTWPGQCCERAACSPQSPKMAPKIKKGLKGFIDDVLGDLLGDDTIIPEKPLEPVPLNRDATDVPQKLPSSKARGRSFREGEVFNTLGSLAGADAEASDISDADPQALLQAIKDLDDMDADLLGLKKSPASDKREAKGSGKEELPRNSKPADKLTASEKDLEDSSGRLLSDDEGRIARKAPVTESKTASNRNPSTVRGPGPSIPLTPGDTPIRRKEELLFDDGDDIMATLGFEDSPTAERRQMGDQEGPRPARSKLDELLGRGTATKLLARPGTGEHREFKLDKKYQRSQDEEDAWDDEILTFGVYQPTLGSSEGRQSRRQSVRFLAESGPDPKGEPGSKRSPPVASSPIQPRKGGADWLGLKDEDLDLLPPSSTQEAQGGDSAIFTPSVPPPVSQHLAPGLHSTPAGLHSSGTKLPAEGAVSPAKSNQAAKLGAAREEEEKEDWLSHILSQKKSQGLAREEHTGACETLNPVGTAGSALSASQPIASIQGLDQAAAGRTSGRATAQEALATRPDAAGSPTSCSQGPLALSAGDLKRRAVSGDPSHTEPTTRFPSSQEPTGLLVPVQSLVSQSLVQNLLPDMGYQKPLLVAQTQLQSSAAPLQTELLQCQARLAEMEAQVRKLELERAQHRLLLESLQQQHQADLELIESAHRPFRGCSLSRSRIKVLETSYQQREERLRRENEELSAQYLSHCQEAEQARTELTAQHQRRLAAAEQEKVQEMERLRELQQASIMEMRKDHEEQLQRLKLLKDREIDAVTSATSHTRSLNGIIEQMENFSSSLNELASRVEASHLTTSQERELGIRHRDEQLRVLKEQLGRQQRDMEEERGRLQEVIGKMEARLSEQSRLLEQERWRVTSEQSKAESMQRALEEQRKVMVQQITMEREELERAKSTLLEEQKSVMHKCGEERRRLAVEWAEFSTQQKLSKERADREVERALQVDTQREVTIISLAKEQAELKIRASELRAKEEQLATEREAVERERQELRLEKEKVKATALSLQLRVEEVEHMSKVASNKYEEGEQALHKARQLPPSLLSPLWGWGQEHLSLAQQRLQLDHVRQDLPCCLPELPPRAQGPAPSSLRAASTFVVPTSASNQHSQLLAGPCPTHLLTKLVLLKHSAEQDRDFLKNEEFFLEALKKAPYNLASN +>XP_012925593.1_PREDICTED:_nuclear_receptor-binding_protein_isoform_X1 +MSEGESQTVLSSGSDPKVESSSSAPGLTSVSPPVTSTTSAASPEEEEESEDESEILEESPCGRWQKRREEVNQRNVPGIDSAYLAMDTEEGVEVVWNEVQFSERKNYKLQEEKVRAVFDNLIQLEHLNIVKFHKYWADIKENKARVIFITEYMSSGSLKQFLKKTKKNHKTMNEKAWKRWCTQILSALSYLHSCDPPIIHGNLTCDTIFIQHNGLIKIGSVFHRIFANVAPDTINNHVKTCREEQKNLHFFAPEYGEVTNVTTAVDIYSFGMCALEMAVLEIQGNGESSYVPQEAISSAIQLLEDSLQREFIQKCLQPAPARRPTARELLFHPALFEVPSLKLLAAHCIVGHQHMIPENALEEITKNMDTSAVLAEIPAGPGREPVQTLYSQSPALELDKFLEDVRNGIYPLTAFGLPRPQQPQQEEVTSPVVPPSVKTPTPEPAEVETRKVVLMQCNIESVEEGVKHHLTLLLKLEDKLNRHLSCDLMPNENIPELAAELVQLGFINEADQSRLTSLLEETLNKFNFARNSTLNSAAVTVSS +>XP_012927835.1_PREDICTED:_sodium/hydrogen_exchanger_3_isoform_X1 +MSRHTGPLWAVLAALVLPRAGAIEEEPSGASQGFQIVTFKWHHVQDPYIIMLWILVASLAKIVFHLSHKVTRIVPESALLIMLGLVLGGIVWAADHIASFTLTPTVFFYYLLPPIVLDAGYFMPNRLFFGNLGTILLYAVIGTVWNAATTGLSLYGVFCSGLMGDLQSGLLDFLLFGSLIAAVDPVAVLAVFEEVHVNEVLFIIVFGESLLNDAVTVVLYSVFESFVTLGGDKVTGVDCVKGIVSFFVVSLGGTLVGVVFAFLLSLVTRFTKHVRIIEPGFVFVISYLSYLTSEMLSLSAILAITFCGICCQKYVKANISEQSATTVRYTMKMLASGAETIIFMFLGISAVDPLIWTWNTAFVLLTLLFISVYRTIGVILQTWILNRYRMVQLEPIDQVVMCYGGLRGAVAYALVVLLDKKKVKEKNLFVSTTLIVVFFTVIFQGLTIKPLVQWLKVKRSEQKEPKLNEKLHGRAFDHILSAIEDISGQIGHNYLRDKWSNFDRKVLSKVLMRRSAQKSRDRILNVFHELNLKDAISYVAEGERRGSLAFIRSPSTDNMVNVDFSTPRPSTVEASVSYLLRENVSAVCLDMQSLEQRRRSIRDTEDMVTHHTLQQYLYKPRQEYKHIYSRHKLTPNEAEKQDKEIFHRTMRKRLESFKSAKLGMNQNKKAAKLYKRERAQKRRNSSIPNGKLPMESLAHNFAIKEKEFELLDAEEAPDYEVEETSGGIEFLANVTKDTASDSPAGDTGSDTPLTRPSSPRRGPPAVLQPPHPAMSPPASPAQSSRMPGPGAHARSAAARRVHSRRSFQRPRARRRPELRKLASLQPPGPAELPPLALEQEETPL +>XP_004843644.1_PREDICTED:_zinc_finger_protein_70 +MEVSPATKFRETFVFEDRLETRQDLFQGEDLGDPFLQEKGLEQMAVIYKEIPLGEQDLECDDYEGNFSLCSSPVHPQSILPGVRPQDEEIFGQAFLKKPDISVCQIIHGEESSPQAHEEVARGHLGPNAPHRTPQPAKPYACRECGKAFSQSSHLLRHLVIHTGEKPYECCECGKAFSQSSHLLRHQIIHTGEKPYECRECGKAFRQSSALSQHQKIHTGKRPYECRECGKDFSRSSSLRKHERIHTGERPYQCKECGKSFNQSSGLSQHRKIHTLKKPHECDLCGKAFCHRSHLIRHQRIHTGKKPYKCEECGKAFSQSSNLIEHRKTHTGEKPYKCHKCGKAFSQSSSLIEHQRIHTGEKPYECCQCGKAFCHSSALIQHQRIHTGKKPYGCECGKAFRHRSALIEHYKTHTREKPYVCNLCGKSFRGSSHLIRHQKIHAGEKL +>XP_012933259.1_PREDICTED:_serine/threonine-protein_kinase_greatwall_isoform_X1 +MESAGSERERGGGAAAGPWAHAVPVPRPPSIEEFTIVKPISRGAFGKVYLGQKGGRLYAVKVVKKADMINKNMTHQLQAERDALALSKSPFIVHLYYSLQSASNVYLVMEYLIGGDVKSLLHIYGYFDEEMAVKYISEVALALDYLHRHGIIHRDLKPDNMLISNEGHIKLTDFGLSKVTLNRDINMMDILTTPSMAKPKQDYSRTPGQVLSLISSLRFFTPVAEKNQDSTDILSAHLSETSQLSQGLICPMSIDQKETTPYSSKLYSCLETLAPQPGVPMRCLTPGLLQSRRRLATSSTSSQSHTFVSSVESDCHSSPKWERDCQESDEASGSTMLSWNAMEKLCTKSANDLETQSFHKKDLEVALSPIHNSSAIPTTGEPCVNLAEKCSSGEVSWEARELEVDKVNLAPDPGQPRCQQSKQRALNSSSMPEEPLGKRSLKRNFELVESSPCQEIIQNKKNCVENKDSKGMRDCHANHSTGLTAEVRALNFSAFGCQQNHRANQENSVHCFAGKHTPENVPVPVIAKNLLCELDEDWEKTNKKECLSSNFLCCDDDSGPRSICMDSDSSFPGISVMESSLERQSLDPDKSIKESSFEESNIEAQLTVSPSYQQNALPKDDENSAVQDSNPKMLAPSEVWKTLTVSKRNAVAFRSFNSHINASSNSEPSRMSITSLDAMDISCAYSGSYPVAVTPTQKGRSSQPYQQTPNQTKSGTSYRTPKSVRRGAAPVDDGRVLGTPDYLAPELLLGTAHDIPWPEGEEKLSNNAQSAVEILLTIDDTKRAGMKELRHHPLFSDVDWENLQHQTMPFIPQPDNETDTSYFEARNNAQHLTISGFSL +>XP_004875104.1_PREDICTED:_uncharacterized_protein_LOC101699736 +MAKETRSNFLDLFFSLFLCKKKRFPLADEGKGPFNSSSLHGGGCQTRWGSLRCLPPATSRNKWSESAPFQANFFPVRLGPAGGRGVVPPPKRSTPRLGAGQEARSSQRTTFLVSVLTSLTPGRGPRRPAEEGGQRERRRGRGREGAAGGGVLGLSLPPPYFRHLTPSAKRAVPPRRRRQRFLLAGPGGSATAGRAPGPRATCRTHRASAGGPGRPARPGPAAPHPARSPRPAPAPAPRRRAPRSGHARTLRTSHAVTGSPQPASPRAPSGSLLPAPRRSCRCRCRSGWFTRLTLGEVWRCRLDVRRSASLSLPPAGGAQGELEVEQNKKAAYWMQKRKNYGLNFQLGNRLRMANRNMRTHCQLEVEAQVSLGDSRSFHVAVTTRPKPELPVTLVTVTGAGGLPFGAAACSEVTLWGYLLSLMGSNGGSLLSRLLSAEGKKLLLRRGESQEHNTVPVSQKHSLSSLV +>XP_012933192.1_PREDICTED:_retinoic_acid_receptor_alpha_isoform_X2 +MASNSSSCPTPGGGHLNGYPVPPYAFFFPPMLGGLSPPGTLTSLPHQLPVSGYSTPSPATIETQSSSSEEIVPSPPSPPPLPRIYKPCFVCQDKSSGYHYGVSACEGCKGFFRRSIQKNMVYTCHRDKNCIINKVTRNRCQYCRLQKCFEVGMSKESVRNDRNKKKKEAPKPESSESCTLTPEVGELIEKVRKAHQETFPALCQLGKYTTNNSSEQRVSLDIDLWDKFSELSTKCIIKTVEFAKQLPGFTTLSIADQITLLKAACLDILILRICTRYTPEQDTMTFSDGLTLNRTQMHNAGFGPLTDLVFAFANQLLPLEMDDAETGLLSAICLICGDRQDLEQPERVDLLQEPLLEALKVYVRKRRPSRPHMFPKMLMKITDLRSISAKGAERVITLKMEIPGSMPPLIQEMLENSEGLDTLSGQPGGGGREGGGLATATGSCSPSLSPASNRSSPATHSP +>XP_012922790.1_PREDICTED:_amiloride-sensitive_sodium_channel_subunit_alpha_isoform_X1 +MDSQGSMKGAELEAGGPSPPQPTQGLAKGDESEQPGLGPEPTAPQQCLEEEEALIEFHRSYRELFQFFCNNTTIHGAIRLVCSKHNRMKTAFWAVLWLCAFGMMYWQFGLLFGEYFSHPVSLSINLDSDKLVFPAVTVCTLNPSRYKEIKEQLRELDRITEQTLFDLYKYNASSTLLAGARGRRDLEETLLHPLQRIPVSPGPGRARSAASSLKDNNPQVDRKDWRIGFQLCNQDKSDCFYQTSSSGVDAVREWYRFHYINILARLADTSPSLEEEALGNFIFTCRFNQAPCTQANYSHFHHPIYGNCYTFNNKNDSSLWMSSMPGIHNGLSLTLRTEQNDYIPLLSTVTGARVTVHGQDEPAFMDDGGFNLRPGVETSISMRKEALHRLGGDYGDCTQDGSDVPVQNLYPSKYTQQVCIHSCFQESMVENCGCAYIFYPRPKGVEFCDYRNHSAWGYCYYKLQGAFSSDSLGCFNKCRKPCSVTNYKLSAGYSRWPSVASQDWIFQMLSLQNNYTINNKRNGVAKLNIFFKELNYKTNSESPSVTMVTLLSNLGSQWSLWFGSSVLSVVEMAELIFDLLVITFLLLLRRLRSRYWSPGRGAGPAREAACTPARFCPHPASPDLAAPPPAYATLSACPPPPGWACAPGQP +>XP_004865340.1_PREDICTED:_transmembrane_protein_168 +MCKSLRYCFSHCLYLAMTRLEEVNREVNMHSSVRYLGYLARINLLVAICLGLYVRWEKTANSLILVIFILGLFVLGIASILYYYFSMEAASLSLSNLWFGFLLGLLCFLDNSSFKNDVKEESTKYLLLTSIVLRLLCALVERISGYVRHRPTLLTTVEFLELVGFAIASTTMLVEKSLSVILLVVALAMLIIDLRMKSFLAIPNLVIFAVLLFFSSLETPKNPIAFACFFICLITDPFLDIYFSGLSVTERWKPFLYRGRICRRLSVVFSGLIELTFFILSAFKLRDTHLWYFVIPGFSIFGIFWMICHVIFLLTLWGFHTKLNDCHKVYFAHRADNNSLDRIMASKGMRHFCLISEQLVFFSLLATAIFGAVSWQPTNGIFLSMFLIVLPLESMAHGLFHELGNCLGGTSVGYAIVIPTNFCSPDGQPTLLPPEHVQELNLRSTGMLNAIQRFFAYHMIETYGCDYSTSGLSFDTLHSKLKAFLELRTVDGPRHDTYVLYYSGHTHGSGEWALAGGDILRLDTLLEWWREKNGSFCSRLIIILDTENSTPWVKEVRKVNDQYIAVQGAEMAKIVDIEEADPPQLGDFTKDWVEYNCNSSNNICWTEKGRTVKALYGVSKRWSDYTLHLPTGSDVAKHWMLHFPRITYPLVHLANWLCGLNLFWICKTCFRCLKRLKMRWFLPTVLDTGQGFKLVKS +>XP_004846012.1_PREDICTED:_ethylmalonyl-CoA_decarboxylase_isoform_X1 +MANSLLKTSSLSARTKLLHIQGVSLYNTTHGFQEEEVKKTLQQFPGGSVDLQKDNTGIGILTLNNPSKMNAFSGTMMLQLLEKVIELENWTEGKGLIVRGAKNTFSSGSDLNAVKALATGEVGMALCMFMQSTLTRLARLPLISVALVQGRALGGGAEFTTACDFRLMTPESEIRFVHKEMGIIPSWGGTSRLVEIIGSREALKVLGGALKLDPKKALNIGMVEEILQSSDEMKSLEEAQAWLTQFVNGPPEVIRALKKSVCSGKELYLEEALQNERDLLGTVWGGAANLQAIARRGKFNK +>XP_012929583.1_PREDICTED:_ectonucleotide_pyrophosphatase/phosphodiesterase_family_member_2_isoform_X4 +MDSAQQTALKQDSRATAEWQERREHDEIELRANQRSLSTSQVGLPRVTRLNSEPQAEQPASERKAAAGSGLSKNLGMAGGGAARPCQALSLFTFAVLCLGATVSRTKRAEEWDESSLSVLSDSPWTNVSGSCKGRCFELEEVGPPDCRCDNLCKSYSSCCQDFDELCLKTARGWECTKDRCGEARDEEHACHCSEDCLARGDCCTNYQVVCKGESHWVDDDCEELKAPECPAGFARPPLIIFSVDGFRASYMKKGSKVMPNIEKLRSCGTHSPYMRPVYPTKTFPNLYTLATGLYPESHGIVGNSMYDPVFDATFHLRGREKFNHRWWGGQPLWITAAKQGVRAGTFFWSVAIPHERRILTILQWLSLPDNERPSVYAFYSEQPDLSGHKYGPFGPEMTNPLRDIDKTMGQLMDGLKQLKLHRCVNVIFVGDHGMEDVTCERTEFLSNYLTNVDDITLVPGTLGRIRSKFSNNAKYDPKVIMANLTCKKPDQHFKPYLKQHLPKRLHYANNRRIEDIHLLVERRWHVASRKSLDVYRKSTGKCFFQGDHGFDNKVNSMQTVFVGYGPTFKYKTKVPPFENIELYNVMCDLLGLKPAPNNGTHGSLNHLLRSNIFRPAMPEEVTRPSYPGIMYLQSDFNLGCTCDDKNKLDELNKRPHTKGSTEAETRKFRSSKNENKENINGSFEPRKERHLLYGRPAVLYRTRYDVLYHTDFESGYSEISLMPLWTSYTVSKQAEVSLIPEHLASCVRPDVRISPGISQSCLAYKNDKQMSYGFLFPPYLSSSPEAKYDAFLVTNMVPMYPAFKRVWSYFQRVLVKKYASERNGVNVISGPIFDYDYDGLHDTEEKTTQYVEGSSIPVPTHYYSILTSCLDFTQPADKCDGPLSVSSFILPHRPDNDESCNSSEDESRWVEDLMKMHTARVRDIEQLTGLDFFRKTSRSYPEILALKTYLHTYESEI +>XP_004839490.2_PREDICTED:_neurexin-1-beta_isoform_X7 +MGAALLQRGGCALLCLALLLLGCWAELGSGLEFPGAEGQWTRFPKWNACCESELSFELKTRAARGLVLYFDDEGFCDFLELVLTRGGRLQLSFSIFCAEPATLLADTPLNDGAWHRVRLRRQFRNTTLLIDRVEARWVEVQSKRRDMTVFSGLFVGGLPPELRAAALKLTRASVREHAPFRGWIRDVRVDAARTLPEDGAEVRLDDDEPSGGGPCEVEEGAGGVCLNGGVCSVVDDRAVCDCSRTGFRGEDCSQGKEEYIATFKGSEYFCYDLSQNPIQSSSDEITLSFKTLQRNGLMLHTGKSADYVNLALKNGAVSLVINLGSGAFEALVEPVNGKFNDNAWHDVKVTRNLRQHSGIGHAMVNKLHCSVTISVDGILTTTGYTQEDYTMLGSDDFFYVGGSPSTADLPGSPVSNNFMGCLKEVVYKNNDVRLELSRLAKQGDPKMKIHGVVAFKCENVATLDPITFETPESFISLPKWNAKKTGSISFDFRTTEPNGLILFSHGKPRHQKDAKHPQMIKVDFFAIEMLDGHLYLLLDMGSGTIKIKALQKKVNDGEWYHVDFQRDGRSGTISVNTLRTPYTAPGESEILDLDDELYLGGLPENKAGLVFPTEVWTALLNYGYVGCIRDLFIDGQSKDIRQMAEVQSTAGVKPSCSRETAKPCLSNPCKNNGMCRDGWNRYVCDCSGTGYLGRSCEREATVLSYDGSMFMKIQLPVVMHTEAEDVSLRFRSQRAYGILMATTSRDSADTLRLELDAGRVKLTVNLDCIRINCNSSKGPETLFAGYNLNDNEWHTVRVVRRGKSLKLTVDDQQAMTGQMAGDHTRLEFHNIETGIITERRYLSSVPSNFIGHLQSLTFNGMAYIDLCKNGDIDYCELNARFGFRNIIADPVTFKTKSSYVALATLQAYTSMHLFFQFKTTSLDGLILYNSGDGNDFIVVELVKGYLHYVFDLGNGANLIKGSSNKPLNDNQWHNVMISRDTSNLHTVKIDTKITTQITAGARNLDLKSDLYIGGVAKETYKSLPKLVHAKEGFQGCLASVDLNGRLPDLISDALFCNGQIERGCEVALMKADLQGPSTTCQEDSCSNQGVCLQQWDGFSCDCSMTSFSGPLCNDPGTTYIFSKGGGQITYKWPPNDRPSTRADRLAIGFSTVQKEAVLVRVDSSSGLGDYLELHIHQGKIGVKFNVGTDDIAIEESNAIINDGKYHVVRFTRSGGNATLQVDSWPVIERYPAGNNDNERLAIARQRIPYRLGRVVDEWLLDKGRQLTIFNSQATIIIGGKEQGQPFQGQLSGLYYNGLKVLNMAAENDANIAIVGNVRLVGEVPSSMTTESTATAMQSEMSTSIMETTTTLATSTARRGRPPTKEPVSQTTDDILVASAECPSDDEDIDPCEPSSGGLANPTRVGGREPYPGSAEVIRESSSTTGMVVGIVAAAALCILILLYAMYKYRNRDEGSYHVDESRNYISNSAQSNGAVVKEKQPSSAKSANKNKKNKDKEYYV +>XP_004840752.1_PREDICTED:_vasopressin-neurophysin_2-copeptin +MPDTMLPACFLGLLAFTSACYFQNCPRGGKRAVTDTELRQCLPCGPGGQGRCFGPSICCADALGCFVGTAEALRCQEENYLPSPCQSGQKPCGSGGRCAANGVCCSPESCVIQPECREGFHRLARAGDRSNATQLDGPAGTLLLRLVQLAGLPDPKPATPGGY +>XP_012934276.1_PREDICTED:_zinc_finger_and_BTB_domain-containing_protein_44_isoform_X3 +MGVKTFTHSSSSHSQEMLGKLNMLRNDGHFCDITIRVQDKIFRAHKVVLAACSDFFRTKLVGQAEDENKSVLDLHHVTVTGFIPLLEYAYTATLSINTENIIDVLAAASYMQMFSVASTCSEFMKSSILWNTPNSQPEKSIDAGQENSNCNFTSRDGSISPVSSECSVVERTIPVCRESRRKRKSYIVMSPESPVKCSTQTSSPQVLNSSASYTENRNQPVDSSLAFPWTFPFGIDRRIQSEKTKQAENTRALELPGPSEAGRRMTDCVTCESTKASLPLGTEEDIRVKVERLSDEEVHEEVSQPVSASQSSLSDQQTVPGSEQVQEDLLISPQSSSIGSVDEGVTEGLPTLQNTSSTNVHVDDDDRTERPSPNGPDRPFQCPTCGVRFTRIQNLKQHMLIHSGIKPFQCDRCGKKFTRAYSLKMHRLKHEVIS +>XP_004857271.1_PREDICTED:_sedoheptulokinase +MLSVAKSVALETDSRSPSQKSSLRVRRLTGLRAALVAANMAVESVTLGIDLGTTSVKAALLEAAPGQPSGFMVLASCARTSRADAESNVAVPQGREQDVSRIIRALNECLAALPQKQLQKVGAIGVSGQMHGVVLWKTGQGCEWMQGGSASMFEARAVSHLVTWQDGRCSSEFLGSLPQPSSHLSVATGFGCATIFWLLKNSPELLQSYNAAGTIQDYVVAMLCGLRRPLMSDQNAASWGYFNTQSQSWNLEILRSSGFPVHLLPDIAQPGSAAGRTSHMWFEIPKGTQVGVAMGDLQASVYSCMGQKTDAVLNISTSVQLAASMPSGFQPTQTPDPASPVAYFPYFDRTYLGVAASLNGGNVLATFVHMLIQWMADLGQQSRPRETMAVTCRGHLEGLKVK +>XP_004873239.1_PREDICTED:_kinesin_light_chain_3_isoform_X2 +MSVQVAAPGGAGLGPERLPPEELVRQTRQVVQGLEALRAEHHSLAGHLGEALAGQGPVAGLELLEEKQQVVSHSLEAIELGLGEAQVLLALSAHVGSLEAEKQRLRAQARRLVQENTWLREELQETRQRLWASEAAVAQLEEEKSHLQFLGQLRQYDPPEESQRPDSPPRRDSLASLFPSEEEEHKGPEAAGVAAAQQGGYEIPARLRTLHNLVIQYAGQHRYEVAVPLCRQALEDLERSSGHCHPDVATMLNILALVYRDQNKYKEATDLLHDALQIREQTLGPEHPAVAATLNNLAVLYGKRGRYREAEPLCQRALEIREKVLGADHPDVAKQLNNLALLCQNQGKFEDVERHYARALSIYEALGGPNDPNVAKTKNNLASAYLKQSKYQQAEELYKEILRPEDLHSPLGAPGTGTAGDMKQQALPRSSSFSKLRESIRRGSEKLVSRLRGEGLAGAAGMKRALSLNVLNMDGQRALGTQLPSRPLGEASRTFSASTQDLSPH +>XP_004856751.2_PREDICTED:_myelin_protein_zero-like_protein_3_isoform_X3 +MLQSRCTWGVHIVISLEINADTHVRGYVGEKIKLRCMFKSTSHVTDKLTIDWTYRPPSSSRTESIFHYQSFQYPTTAGTFRDRISWAGNVYKGDASISISNPTLKDNGTFSCAVKNPPDVHHNIPLTELTVTERGFGTMLSSVALLSILVFIPSAVVVILLLLRMGRKAAGLKKRSKSGYKKSSIEVSDDTDQEEKDECMARLCVRCAECLDSDYEETY diff --git a/files/final_project/example/Proteins_2.fasta b/files/final_project/example/Proteins_2.fasta new file mode 100644 index 00000000..d9e9143a --- /dev/null +++ b/files/final_project/example/Proteins_2.fasta @@ -0,0 +1,200 @@ +>XP_004841024.1_PREDICTED:_cathepsin_Z +MAGRGPLGPLLLLWLLAGAARAALYFRRGQTCYRPLRGDQLSQSGRRTYPRPHEYLSLSDLPKTWDWRSVDGVNYASVTRNQHIPQYCGSCWAHGSTSAMADRINIKRKGAWPSTLLSVQHVIDCGGAGSCEGGSDLLVWKYAQEHGIPDETCNNYQAKDQECDKFNQCGTCTEFKECHTIQNYTLWRVGDYGSLSGREKMMAEIYKNGPISCGIMATEKMANYTGGIYAEYHEDAFINHVISVVGWGVSSDRTEYWIVRNSWGEPWGERGWMRIVTSTYKDGKGASYNLAIEESCAFGDPII +>XP_012923888.1_PREDICTED:_armadillo_repeat-containing_X-linked_protein_3 +MGYARKVGWVTAGLVIGASACYCIYRLTRGRKYNKEKMAEGGSGDVDDAGDCSGARYNDWSDDDDDGNDSKSIVWYPPWARIGTEAGTRARARARARATRARRAVQKRASPNSDDTILSPQELQKVLCLVEMSEKPYILEAALIALGNNAAYAFNRDIIRDLGGLPIVAKILNTRDPIVKEKALIVLNNLSVNAENQRRLKIYMNQVCDDTITSRLNSSVQLAGLRLLTNMTVTNEYQHMLANSISDFFRLFSAGNEETKLQVLKLLLNLAENPAMTRELLRAQVPLSLGSLFNKKENKEVILKLLVVFENLSDNFRWEENEPTQNQFGEGSLFFFLKEFQVCADKVLGIESHHDFLVKVKVGKFMAKLAENMFPKIQE +>XP_004839941.1_PREDICTED:_uncharacterized_protein_LOC101709220_isoform_X1 +MPLSGPSLCWAFLPPCLFLWKLESICALQVQLGGFGQPWRGSHTALEQDHLSQPAPQHPGPSSSEDESTPRVAGRPPWKMPTRHSTPEGKETALHWSPRPRGQASHLQESLTSARSAQDLVSHPGGLSPGATFRKRRLSTIYALEEGPSEQSGPCSEASVLEDDLPVPASLARPQEKAEDPQAKSWPRSPGLPGVPNTARKKRRDPKEWAAVMLRVRQWEARLLQDIEAAVHHELTIQDEGAPDIGMIQVEIQEPTTSG +>XP_004835491.1_PREDICTED:_COP9_signalosome_complex_subunit_2_isoform_X1 +MSDMEDDFMCDDEEDYDLEYSEDSNSEPNVDLENQYYNSKALKEDDPKAALSSFQKVLELEGEKGEWGFKALKQMIKINFKLTNFPEMMNRYKQLLTYIRSAVTRNYSEKSINSILDYISTSKQNSDFLCQMDLLQEFYETTLEALKDAKNDRLWFKTNTKLGKLYLEREEYGKLQKILRQLHQSCQTDDGEDDLKKGTQLLEIYALEIQMYTAQKNNKKLKALYEQSLHIKSAIPHPLIMGVIRECGGKMHLREGEFEKAHTDFFEAFKNYDESGSPRRTTCLKYLVLANMLMKSGINPFDSQEAKPYKNDPEILAMTNLVSAYQNNDITEFEKILKTNHSNIMDDPFIREHIEELLRNIRTQVLIKLIKPYTRIHIPFISKELNIDVADVESLLVQCILDNTIHGRIDQVNQLLELDHQKRGGARYSALDKWTNQLNSLNQAVVSKLA +>XP_004853463.1_PREDICTED:_rab_GTPase-activating_protein_1-like_isoform_X5 +MVENGSWSMTFEERENRRLQEASMRLEQENDDLAHELVTSKIALRNDLDQAEDKADVLNKELLLTKQRLVETEEEKRKQEEETAQLKEVFRKQLEKAEYEIKKTTAIIAEYKQICSQLSTRLEKQQAASKEELEVVKGKMMACKHCSDIFSKEGALKLAAISREDQGIEADDEKDSLKKQLREMELELAQTKLQLVEAKCKIQEIEHQRGALMNEIQAAKNSWFSKTLNSIKTATGTQPLQPPQAPQPPKEST +>XP_012930843.1_PREDICTED:_SUN_domain-containing_ossification_factor_isoform_X1 +MKKYRRALALVSCLSLCSLVWLPSWHVCCKESSSASATSYYSQGDNCALENEGVQLQKKDERKGPINAELPGKPSSDLPNPPEENKLKDDHIVDVRNAESEELRQSVIETLPTVDLHEDSSSVVMSNENVENTSSLSTSEITPVAKLDEIEKSSTIPIAKSSETEQSETDCDVGDASVQQPSFVSPPESLVGQHIENVSSSHGKGKITKSEFESKVSANEQGDDSPKSALNASDNLKNESSDFIKPGETDPTPPANPKDPEDIPTFDEWKKKVMEVEKEKSQSLHPSSNGGPHAAKKVQKNRNNYASVECGAKILAANPEAKSTSAILIENMDLYMLNPCSTKIWFVIELCEPIQVKQLDIANYELFSSTPKDFLVSISDRYPTNKWIKLGTFHGRDERNVQSFPLDEQMYAKYVKMFIKYIKVELVSHFGSEHFCPLSLIRVFGTSMVEEYEEIADSQYQSERQELFDEDYDYPLDYNTVEDKSSKNLLGSATNAILNMVNIAANILGAKTEDLTEGNKSLSENATATTAPTMPESTPVSTPVPSPEDVTTEVRATEPSTPDTPKDSPIVQLVQEEEEEASPSTVTLLGSGEQEDESSPWFELETQIFCSELTTICCISSFSEYIYQWCSVRIAFYRQRSRAAVSKGKDCRVSAQPSILLPAQSVDVSVLQPPSGELDSKNMERESETVILDDLSNAHHGDLINHTVEVIELEPSLFQTLSQSLLLDITPEINSLSKIEGSESVKHETGHTPSQVITQESSVEFDNETEKKFESFSSTEKLSMIYETNQVNEVTDNTVKEDVTSIEIITKLSETVVPPINTAIVSDSDSGEAKMNIAHTPKHIVTPAVDSSLPEVKEDEQSPEDALLRGLQRTATDFYAELQNSTDLGYANGNLIHGSNQKESVFMRLNNRIKALEVNMSLSGRYLEELSQRYRKQMEEMQKAFNKTIVKLQNTSRIAEEQDQRQTEAIQLLQAQLTNMTQLVSNLSTTVAELKQEVSDRQSYLVIALVLCVVLGLMLCMQRCRNTSQFDGDYISKLRKSNQYLSPKRCFSSYDDMNLKRRTSFPLIRSKSLQLTDKEVDPNDLYIVEPLKFSPEKKKKRCKYKTEKIETIKPADPLHPIANGDIKGRKPFTNQRDFSNMGEVYHSSYKGPPSEGSSETSSQSEESYFCGISACTSLCNGQSQKTKTEKRALKRRRSKVQDQGKLLKTLIQTKSGSLPSLHDIIKGNKEITVGTFGVTAVSGHI +>XP_004854264.1_PREDICTED:_prokineticin-2_isoform_X2 +MRSPRCAQVLLLLLLPPLLLSPWAGDAAVITGACDKDPQCGRGMCCAVSIWVKSIRICTPMGKVGDSCHPQTRKVPFFGRRMHHTCPCMPGLACLRTSFKQFICLARK +>XP_012930368.1_PREDICTED:_fermitin_family_homolog_3 +MAGMKTATGDYIDSSWELRVFVGEEDPEAESVTLRVTGESHIGGVLLKIVEEINRKQDWSDHAIWWEQKRQWLLQTHWTLDKYGILADARLFFGPQHRPVTLRLPNRRTLCLRASFSKPLFKAVADICRLLSIRHPEELSLLRAPEKKEKKKKEKEPEEEVFDLTKVVLAGGVAPVLFRGMPAHFSDSEHTEACFRMLSRPGPSPDPGLLQRLPRPGSLADKTQLHSRWLDSSRCLMQQGVKAGDILWLRFKYYSFFDLDPKADPVRLTQLYEQARWDLLLEEIDCTEEEMMVFAALQYHINKLTQSGEAGEVASMDPGLDDLDAALNNLEVKLEGSAPTDVLDSLTTIPELKDHLRIFRPRKLTLKGYRQHWVVFKETTLSYYKSQDEAPGDPIQQLNLKGCEVVPDVNVSSQKFCIKLLVPSPEGMSEIYLRCQDEQQYAHWMAGCRLASKGRTMADSSYTSEVQAILAFLSLQRAGGGGSGNHTQGPDASGEGLNPYGLVAPRFQRKFKAKQLTPRILEAHQNVAQLSLTEGQLRFIQAWQSLPDFGISYFMVRFKGSKKDEILGIANNRLIRIDLAVGDVVKTWRFSNMRQWNVNWDIRQVAIEFDEHINVAFGCVSASCRIVHEYIGGYIFLSTRERARGEELDEDLFLQLTGGHEAF +>XP_004834022.1_PREDICTED:_solute_carrier_family_26_member_6_isoform_X2 +MELQKRDYLVERPLLNQEQLEHLGHWGPTPRTHQWRTWFQCSHSRAHGYLLKYLPVLGWLPHYRVREWLLGDLLSGLSVAIMQLPQGLAYALLAGLPPVFGLYSSFYPVFVYFLFGTSRHISVGTFAIMSVMVGSVTESITQDEDFQQNTNSTVSARVQLASTLSVLVGLFQVALGLVHFGFVVNYLSEPLVRSYTTAASVQVFVSQLKYVFGLQLSSRSGPLSLIYTFLEVCWNLPKSVVGTVVTAVVAGVALVMVKILNDKLHRHLPLPIPGELLTLIAATGISYGVNLRNRFEVDTVGTIPTGLIAPMIPNPQLFGKLVGHAFAIAVVGFAIAISLGKIFALRHGYRVDSNQELVALGLSNFVGGFFQCFPVSCSMSRSLVQETTGGNTQVAGAVSSLFILLIILKLGELFRELPKAVLAAIIIVNLKGMLKQFTDICTLWKANRVDLLIWVVTFVATILLNLDLGLAVAIGFSLLLVVVRTQMPRYSVLGQVPDTDIYRDVAEYSEAKEIPGVKVFRSSATLYFANAELYSDTLKQRCGVDVDRLLAQKKKRLRKQERKLKQQQKHKQAASSNGTSVSISVDTSLGDIKGSGVEDSRVKVSPANELEDVVVSRQEDAKAPDVSTLKALGLPRPDFHSLILDLGALSFVDTVCIKSLKNIFRDFREIEVEVYIAACHSPVVTQLEAGCFFDASITKKHLFVSVHDAVTFALQHSRSGPNSPVLATKL +>XP_004871584.2_PREDICTED:_LOW_QUALITY_PROTEIN:_interleukin-20_receptor_subunit_alpha +MKNVLHWNPPESLQGVEVMYAVQYFIYGQKRWLNKPECKNISRTYCDLSDETSDYEHQYYAKVKAIWETNCSKWTEMGRFYPFLETQTGPPKVALTTDEKSISIVLTAPDKWKRNPEDCTISMQQIYSNLKYIVSVYNIKSKRTWSQFVTSPTLVLSCLEPNTLYCVQVESFVPEPPRPAQPSQKQCISTSEDPTSALKVKIILWYVLPTSVIVFLFSVIGYSIYRYIHVGKEKHPDNLILIYGNELDKRVFVPAEKIMINFITLNVLDDSKIPQKDMIRLDKSSDGSKLRDPKPLWNLESPPEEVEVKHLEYTPHLVGIFCNSEENTRATSLTKQESLTSTTAAGEAVVEYXCDVRTDIHGGSEDHQFSTQEGASIQGKLFQQQAALASLGPPMLCSYRPQLSDLHHLAQERSASEEGLEEESSTTLVDWDPRTGKLCIPSLSSFDQDPEGSEHSESDGLTEEGLLSRLYKEQVPAKTEEDENYVLQFTEEWGLYVPMES +>XP_004873235.1_PREDICTED:_kinesin_light_chain_3_isoform_X1 +MSVQVAAPGGAGLGPERLPPEELVRQTRQVVQGLEALRAEHHSLAGHLGEALAGQGPVAGLELLEEKQQVVSHSLEAIELGLGEAQVLLALSAHVGSLEAEKQRLRAQARRLVQENTWLREELQETRQRLWASEAAVAQLEEEKSHLQFLGQLRQYDPPEESQRPDSPPRRDSLASLFPSEEEEHKGPEAAGVAAAQQGGYEIPARLRTLHNLVIQYAGQHRYEVAVPLCRQALEDLERSSGHCHPDVATMLNILALVYRDQNKYKEATDLLHDALQIREQTLGPEHPAVAATLNNLAVLYGKRGRYREAEPLCQRALEIREKVLGADHPDVAKQLNNLALLCQNQGKFEDVERHYARALSIYEALGGPNDPNVAKTKNNLASAYLKQSKYQQAEELYKEILRPEDLHSPLGEPHPPCRLPGASALCPPLTSPSVPPGAPGTGTAGDMKQQALPRSSSFSKLRESIRRGSEKLVSRLRGEGLAGAAGMKRALSLNVLNMDGQRALGTQLPSRPLGEASRTFSASTQDLSPH +>XP_004835325.1_PREDICTED:_SET_domain-containing_protein_5_isoform_X1 +MEVLRDPIKKNSSESKPAQSGFSRGNSPLSCPESVEASPAVNEKSVYSTHNYGTTQRHGCRGLPYADHNYGAPPPPTPPASPPVQTIIPRSDLNGLPSPVEERCGDSPNSEGETVPTWCPCGLSQDGFLLNCDKCRGMSRGKVIRLHRRKQDNISGGDSSATESWDEELSPSTVLYTATQHTPTSITLTVRRTKPKKRKKSPEKGRAAPKTKKIKAFREGSRKSLRMKNSPSEAQNLDENTTEGWENRIRLWTDQYEEAFTNQYSADVQNALEQHLHSSKEFVGKPAILDTINKTELACNNTVIGSQMQLQLGRVTRVQKHRKILRAARDLALDTLIIEYRGKVMLRQQFEVNGHFFKKPYPFVLFYSKFNGVEMCVDARTFGNDARFIRRSCTPNAEVRHMIADGMIHLCIYAVSAITKDAEVTIAFDYEYSNCNYKVDCACHKGNRNCPIQKRNPNATELPLPPPPNLPTIGAETRRRKARRKELEMEQQNEATEENNDQQPQEVPEKVNASSDHQEVDNPDEKPEEEKEEVTEDLENPAHSRRTREDKKVEAIIHAFENLEKRKKRRDQPLEQSTPDIEITTTTSETPVGEETKTESPESEVSNTASNISIPSTPQNIGVNTRRSSQAGDVAVEKPLPKAPPAKPSRPRPKSRISRYRTSSAQRLKRQKQANAQQAELSQAALEEGGNNNSAAPTEAGILDSSGENRQLTGSDLTLLSVPGSHVNRAASKYPKTKKYLVTEWLNDKAEKQECPVECPLRITTDPTVLATTLNMLPGLIHSPLICTTPKHYIRFGSPFMPERRRRPLLSDGTFSSCKKRWIKQALEEGMTQTSSVPQETRTQHLYQSNENSNSSSICKDNADLLSPLKKWKSRYLMEQNVTKLLQPLSPVTPPPPGSGSKSPQLTTPGHTHPEEECRNGYSLMFSPIASLTTASRCNTPLQFENISSPESSPAHRPESLSPELCHRKDLDLTKVGYLDSNTNSCTDKPSLLNSGPSDLAPHPSIGPASETGFPNRSGDGHQTLMRNSDQAFRTEFNLMYAYSPLNAMPRADGLYRGSPLVGDRKPLHLDGGYCSPAEGFPSRYEHGFMKDLARGSMSPGGERACEGVPSAPQNPPQRKKVSLLEYRKRKQEAKENSAGGGGDSAQNKSKSAGAGQGSSNSVSDTGAHGMQGSSARTPSSPHRKFSPSHSSVSHLEAVSPSDSRGTSSSHCRPQENISSRWMVPTSVERLREGGSIPKVLRSSVRVAQKGEPSPTWESNSTEKDSDPADGECPDTLSSALSKGATVYSPSRYSYQLLQCDSPRTESQILLQQSSSPFRGHPTQSPGYSYRTTALRPGNPPSHSSSESSLSSASFPSPAHPASTDSLAPFTGTPGYYSSQPHSGNSTGSSLPRKSCHSSAASPTLQGPSDSPTSDSVSQSSTGTLSSTSFPQNSRSSLPSDLRTISLPSAGQSAAYQASRVSAVSNSQHYPHRGSGSVHQYRLQPLQGSGVKTQTGLS +>XP_004859328.1_PREDICTED:_MAGUK_p55_subfamily_member_3_isoform_X1 +MPVLSEDSGLHETLALLTSQLSPDSSHREEVGFLRDVFSERSLSYLMKIHEMLRCYEQQSPSPVLHSAVALAEDVVEELQAASAQAHSDERELLQLLATPHLRAMLMVHDTVAQKSFDPVLPPLPDNIDEDFEEESVKIVRLVKSKEPLGATIRRDEHTGAVVVARIMRGGAADRSGLVHVGDELREVNGVAVLHKRPDEISQILAQAQGSITLKIIPATQEGDRFKESKVFMRALFHYDPREDRAIPCQEAGLPFQRGQVLEVVSQDDPTWWQATRVGDTNLRAGLIPSKQFQERRLSHRRAAGTLPSPPSLRKPPYDHPCDSETCDHDGHLKGHYVAGLRRSFRLGCRERPAGLQDGKAPAGCEALELPTYEEVARYQPQPGERPRLAVLIGSLGARLQELKQKVVAENPQHFSVAVPHTTRPRRGQEKEGVEYHFVSRQAFEADLQHNRFLEHGEYKDHLYGTSLGAVRAVVAKNKVCVVDVEPEALKQLRTSEFRPYVIFVKPVVQEKRKTPPLSPAWEDTSGPLDEEQQDMAASAAYVEQHYGHLVDAVLVREDLQGACLQLRALLERLGTDAQWVPVSWVR +>XP_004845215.1_PREDICTED:_non-canonical_poly(A)_RNA_polymerase_PAPD7_isoform_X1 +MSPRPEEAAMRREVVQRIETVVKDLWPTADVQIFGSFSTGLYLPTSDIDLVVFGEWERPPLQLLEQALRKHSVAEPCSIKVLDKATVPIIKLTDQETEVKVDISFNMETGVRAAEFIKNYMKEYSLLPYLILVLKQFLLQRDLNEVFTGGISSYSLILMAISFLQLHPRIDARRADENLGMLLVEFFELYGRNFNYLKTGIRIKEGGAYIAKEEIMKAMTSGYRPSMLCIEDPLLPGNDVGRSSYGAMQVKQVFDYAYIVLSHAVSPLARSYPNRDSESTLGRIIKVTQEVIDYRRWIKEKWGSRVHPLPDLDNRIKMKERLSMCNGEQTPGREPRSPYSPRLALSLCSPQPLSSGSSASSVSSLSGSDVDSDTPPCTTPSVYQFSLQAPAALVGSLPAALPMPSAKPQATPSRTLIMTPNNQTRFAMPAPTLGVAPVPCRQAGVERTASSKAGHHMPAPAVPAAPPNPLCSPHLYHKQHNGMKLSMKGSHGHAQGGGYGSVGSGGVRPPMGNRGHHQYNRTGWRRKKHTHTRDSLPVSLSR +>XP_012921440.1_PREDICTED:_cdc42-interacting_protein_4_isoform_X1 +MDWGTELWDQFEVLERHTQWGLDLLDRYVKFVKERTEVEQAYAKQLRSLVKKYLPKRPTKDDPESKFSQQQSFVQLLQEVNDFAGQRELVAENLSVRVCLELAKYSQEMKQERKMHFQEGRRAQQQLENGFKQLESSKRKFERDCREAEKATQTAERLDQDINATKADVEKAKQQAHLRSHMAEESKNEYAAQLQRFNRDQAHFYFSQMPQIFDKLQDMDERRTTRLGTGYGLLSGAELQVVPIIAKCLEGMKVAADAVDAKNDSQVLIELHKSGFARPSDVEFEDFSQPMNRAPSDSSLGTPSDGRPEVRGTGRSRAKRWPFSKKNKAVVTEDFSHLPPEQQRKRLQQQLEERNRELQKEVDQSAGNGILDLVEALKKMKDVYEKTPQMGDPASLEPQITETLRNIERLKLEVQKYEAWLAEAESRVLSNRGDSLNRHTRPPDPPASAPPDSSSNSNSGSQENKESSSEEPPSEDGQDTPIYTEFDEDFEEPTSPIGQCVAIYHFEGSSEGTISMAEGEDLSLMEEDKGDGWTRVRRKQGGEGYVPTSYLRVMLN +>XP_012927342.1_PREDICTED:_activated_CDC42_kinase_1_isoform_X4 +MPAARRFPGLELSFPLLARLRRRLYTRLGSSSMQPEEGTAWLLELLSEVQLQQYFLRLRDDLNVTRLSHFEYVKNEDLEKIGMGRPGQRRLWEAVKRRKALCKRKSWMSKVFSGKRLEAEFPPHHSQSTFRKPSPTPGAPAGEGPLQSLTCLIGEKDLRLLEKLGDGSFGVVRRGEWDSPSGKTVSVAVKCLKPDVLSQPEAMDDFIREVNAMHSLDHRNLIRLYGVVLTPPMKMVTELAPLGSLLDRLRKHQGHFLLGTLSRYAVQVAEGMGYLESKRFIHRDLAARNLLLATRDLVKIGDFGLMRALPQNDDHYVMQEHRKVPFAWCAPESLKTRTFSHASDTWMFGVTLWEMFTYGQEPWIGLNGSQILHKIDKEGERLPRPEDCPQDIYNVMVQCWAHKPEDRPTFVALRDFLLEAQPTDMRALQDFEEPDKLHIQMNDVITVIEGRAENYWWRGQNTRTLCVGPFPRNVVTSVAGLSAQDISQPLQNSFIHTGHGDSDPRHCWGFPDRIDELYLGNPMDPPDLLSVELSTSRPSQHLGRLKREPPPRPPQPAIFTPKPTYDPVSEDPDALASDFKRLGLRKPGLPWGLWLSKPSARVPGTKAGRGVSGGASEVTLIDFGEDPVVPAPRPCAPSLAQLAMDACSLLDKTPPQSPTRALPRPLHPTPVVDWDARPLPPPPAYDDVAQDEDDFEVCSINSTLVGTGLATGPCQGETNYAFMPEPERCPLALEDNLFLPSQGGAPPPSSAQTAQIFQALQQECMRQLQVPTGSLAPSPGPASDDKPQVPPRVPIPPRPTHPRVELSPAPSGEEELGRWPGPVSPPRVPPREPLSPQSSRTPSPLVPPGSSPLPPRLSSSPGKTMPTTQSFASDPKYATPQVIQAPGPRAGPCILPIVRDGRKVSSTHYYLLPERPPYLERYQRFLREASSPEEPALQPVPLLPPPPSTPAPAAPTATVRPMPQAAPDPKANFSTNNSNPAVRPPTSQRGCPGDGLETARQADEVQMLQAMVHGVTTEECQAALQCHGWSMQRAAQYLKVEQLFGLGLRPRLECHKVLEMFDWNLEQAGCHLLGSFGPAHHKR +>XP_004867815.1_PREDICTED:_pulmonary_surfactant-associated_protein_A +MLLCSLAFTLILMAVSGIMCNRTEYCVGSPGIPGTPGSHGLPGRDGRDGVKGEPGPPGPMGPPGGMPGFPGCNGMSGIPGVPGERGDKGDPGERGPPGLPASLDEQIQTILHDFKHKILQSTGVLILQGSMMAVGDKVFATNGQSVDFNAIKETCVRAGGDIAAPRSPEENAAIASIVKKHNTYTYLGLMEGHTIGDFRYLDGAPVNYTNWYPGEPRGWGKEKCVEMYSDGTWNDRNCVQYRLAICEF +>XP_004845537.1_PREDICTED:_NADH_dehydrogenase_[ubiquinone]_1_alpha_subcomplex_subunit_6 +MAASGLRSGAAVASTAVKPIFSRDMNEAKRRVRELYRAWYREVPHTVSLFQLDITVKQGRDKVREMFMKNAHITDPRVADLLVIKGKMELEETINVWKQRTHVMRFFQETEAPRPKDFLSKFYAGHDP +>XP_012929452.1_PREDICTED:_aprataxin_and_PNK-like_factor_isoform_X1 +MSGGFELQPQDGGPRVALASGETVIGRGPLLGITDKRISRRHAILEVVGGQLRIKPIHTNPCFYRSSENSQLLPMKINLWHWLNPGDSFSLLADKYIFCVVSTHSEMEIECTLRNSQMLDEDDILNEVPKSPVINLPDKTARTSHLERTTEITETQTTSTSSVVRNPFLGECGGLSKQQSDPGQRKRSLPAWMLEDLSDQNLLAPVISGDNSIIQGSGREGICKEKTHINVTQQGRKRISSGNSESVSGGQDAGKKCKDTNQEESVISSKEMPESFSATTLSNPDMHTTKIKTQRNEIPIVGLAKVSKHKIMTKGTLTKGDEALSCSESCSSIQGKSFLSESQRSHPKSNSEASSSDTLHAKETDSLPRSSQENKVKRSSCMYGANCYRKNPVHFQHFSHPGDSDYGGMHVTGQDETDDRPECPYGASCYRKNLQHKIEYRHSILQVRSVSDEDDAVGQPNEYDLNDSFLDDEEEEYELTDEDSDWEPGKEDQEQEDVEELLKEAKKFMKRKK +>XP_004856579.1_PREDICTED:_radixin_isoform_X1 +MPKPINVRVTTMDAELEFAIQPNTTGKQLFDQVVKTVGLREVWFFGLQYVDSKGYSTWLKLNKKVTQQDVKKENPLQFKFRAKFFPEDVSEELIQEITQRLFFLQVKEAILNDEIYCPPETAVLLASYAVQAKYGDYNKEIHKPGYLANDRLLPQRVLEQHKLTKEQWEERIQNWHEEHRGMLREDSMMEYLKIAQDLEMYGVNYFEIKNKKGTELWLGVDALGLNIYEHDDKLTPKIGFPWSEIRNISFNDKKFVIKPIDKKAPDFVFYAPRLRINKRILALCMGNHELYMRRRKPDTIEVQQMKAQAREEKHQKQLERAQLENEKKKREIAEKEKERIEREKEELMERLRQIEEQTMKAQKELEEQTRKALELDQERKRAKEEAERLEKERQAAEEAKSVIAKQAADQLKNQEQLAAELAEFTAKIALLEEAKKKKEEEATEWQHKAFAAQEDLEKTKEELKTVMSAPPPPPPPPVIPPTENEHDEHDENNAEASAELSNEGVMNHRSEEERVTETQKNERVKKQLQALSSELAQARDETKKTQNDVLHAENVKAGRDKYKTLRQIRQGNTKQRIDEFEAMWGPKLYALFQMRSCQSSIKQM +>XP_012920718.1_PREDICTED:_LOW_QUALITY_PROTEIN:_zinc_finger_protein_649-like +MTKAQESLSLEDVAVRFTWEKWQLPGPAQKDLYWDVMLENYSSLVSVGFQASWVDVLSMLEGGEPLWTLEDEIHNQVHPEIEKADDHLQQQLQNQKRPKRVEQCYEQNALGNVQRCKHHFPLRPNHDMFDLYGKILKPXLGLSNQSRRYTIKELAELNADRRSFLCDTHEQTHTKVKSHESRKPTSTESQFLKDQQTYKIEKGHECAKCGEAFLEKSQLTEHKKIHLGKKPHECNTCGKTFYKKFNLTKHQSHLKIHTGNKPHVCPECGKSFARKSLLIVHMPIHIEEKPYLCSECGKEFIQKGNLMIHQRIHMGEKPYRCTDCGKAFSQKICLIAHQRYHTGRMPFVCTECGQSCSQKSVLIRHQRIHSGGKTYKCSDCGKVFITKAKLITHRRTHTGEKPYGCDECKKAYSYMSCLVKHKRTHNREKCSDSMKVENSTVSHTLLDSSTLLQRRNPVDVTVQIPSVTPDTSNISGLLANRSVVPVGQPMARCPPSGENRGFTPERNQSLCITLCHKHAQRRDREVESGARGLPVREQGSAKTSQLAPKSPSPRHSTRNFAADRRRSGGGIEGGIEGGARGLSAPQ +>XP_012923418.1_PREDICTED:_rho_guanine_nucleotide_exchange_factor_11_isoform_X7 +MSVRLPQSIDRLSTLSSLGDSAPERKSPSHHHQPSDTSEATGLVQRCVIIQKDQHGFGFTVSGDRIVLVQSVRPGGAAMKAGVKEGDRIIKVNGTMVTNSSHLEVVKLIKSGAYVALTLLGSSPSSVGVAALQQEPAGHPRVTPMIPPPPPPPPLPPPQRITGPKPLQDPEVQKHATQILRNMLRQEEKELQRICEVYSRNPASLLEEQIEGARRRVTQLQLKIQQETGGLVDILPLYGDASQKPSEGRLSLDSQEADSGLDSGTERLPSLSESWVNRNSVLSDPGLDSPRTSPVIMARVAQHHRRQGSDIPIPLSSEQGVDPSPKPLIIGPEEDYDPGYFNNESDVIFQDLEKLKSRPAHLAVFLRYIFSQADPSPLLFYLCVDVYQQTNPKDSRSLGKDIWSIFLEKNAPLRVKVPEMLQAEIDLRLRNSEDARSILCEAQEAAVPQIQEQIHDYRTKRTLGLGSLYGENDLLDLDGDPQRERQVAEKQLAALGDILSKYEEDRSVPMSFALNTYVSHTGIRLRESRPSSTAEKAQSAPDKDKWLPFFPKAKKSSNSKKEKDVLEDKKRNPILKYIGKPKSSSQSTFHIPLSPVEVKPGNVRNIIQHFENSQQYDAPEPGTQRLSTGSFPEDLLESDSSRSEIRLGRSESLKGREEMKRSRKVENVPRSRSDVDMDAAAEATRLHQSASSSTSSLSTRSLENPTPPFTPKMGRRSIESPSLGFCTDALLPHLLEDDLGQLSDLEPEPDAQNWQHTVGKDVVAGLSQREIDRQEVINELFVTEASHLRTLRVLDLIFYQRMKKENLMPREELARLFPNLPELIEIHNSWCEAMKKLREEGPIIKEISDLMLARFDGPAREELQQVAAQFCSYQSIALELIKTKQRKESRFQLFMQEAESHPQCRRLQLRDLIISEMQRLTKYPLLLENIIRHTQAGTAEHEKLCRARDQCREILKFVNEAVKQTENCHRLEGYQRRLDATALDRASNPLAAEFKSLDLTSRKMIHEGPLTWRISKDKTLDLHVLLLEDLLVLLQRQDERLLLKCHSKTAMGSADSKQTFSPVLKLNAVLVRSVATDKRAFFIICTSELGPPQIYELVALTSSEKNIWMELLEEAVRNATRHPGAALAPVLPRPPGPQEPAHQGPAPSRTGLDDPEVFHSEAEPEELPGGPGTQQRVQGKQPVPPEEPEQEGNAVEGELAALPLPSAALSGENVGVGTRDPIALALPGSLFMEGLADSALEDVENLRHLILWSLLPGHGTDTRAAAEPEDDLTPTPSIIGVTTHPWDPGSPGLAPTSGDGDNAVLPGPEGGQPEHEDAARSLALLPPRTRNSGIWESPELDRNPAEEASSTEEVGSYKVVRKAEVAGSEAVPALPESGQSEPELPEVEGATEAPGNCFYVSMPAGPVDSSTNPSGARTGHPQPQAGSGDPRLPSHSSPGLALRDVGMIFRTIEQLTLKLNRLKDMELAHRELLRSLGGESSGGTTPVGNFHTDTSRWTDSSLSPPATLASEPRDSHEPESHPSDGCDTPPEDSTADIPVSPGL +>XP_004868810.1_PREDICTED:_ATP-sensitive_inward_rectifier_potassium_channel_12_isoform_X1 +MTAASRANPYSIVSSEEDGLHLVTMSGANGFGNGKVHTRRRCRNRFVKKNGQCNIEFTNMDEKSQRYLADMFTTCVDIRWRYMLLIFSLAFLASWLLFGVIFWVIAVAHGDLEPAEGRGRTPCVMQVHGFMAAFLFSIETQTTIGYGLRCVTEECPVAVFMVVAQSIVGCIIDSFMIGAIMAKMARPKKRAQTLLFSHNAVVALRDGKLCLMWRVGNLRKSHIVEAHVRAQLIKPRVTEEGEYIPLDQIDIDVGFDKGLDRIFLVSPITILHEIDEASPLFGISRQDLETDDFEIVVILEGMVEATAMTTQARSSYLANEILWGHRFEPVLFEEKNQYKIDYSHFHKTYEVPSTPRCSAKDLVENKFLLPSANSFCYENELAFLSRDEEDEPEGDQDGCSREGLSPQPRHDFDRRQAGGGALEQRPYRRESEI +>XP_004838994.1_PREDICTED:_long-chain-fatty-acid--CoA_ligase_5 +MKMLFIFNFLFSPLPTPALLCLLTFGAAIFLWLINRPQPVLSRIDLDKQSVGIEGGARKFAFQKNDLARYYFPDAKTMYEIFQRGLAVSDNGPCLGYRKPNQPYRWLSYKQVSDRAEYLGSCLIHKGHKPSPDQFIGIFAQNRPEWVISELACYTYSMVAIPLYDTLGAEATVFIVNKADIPTVICDTPQKASVLIENVEKGLTPCLKLVILMDPFDDDLKQRGEKCGVEVLSLFDAENLGKENFRKPVPPNPEDLSIICFTSGTTGDPKGAMLTHGNIASNVAGFLRSAESVFQPTCNDVTISYLPLAHMFERIVQAVMYSCGAQVGFFQGDIRMLPDDMKALKPTIFPTVPRLVNKIYDKVQNEAKTPLKKFLLNLAVASKFSEVKNGIIRRDSLWDKLIFAKIQNSLGGRVYLVITAAAPISSAVLTFFRAAMGCMVFEAYGQTECTGGCTVTLPGDWTSGHVGPPMCCNYVKLEDVPDMNYFSANNEGEICIKGLNVFRGYLKEPEKTQEVLDKDGWLHTGDIGRWLPNGTLKIIDRKKNIFKLAQGEYIAPEKIENIYSSSGPVSQIFIHGERLQSSLVGVVVPDPDVLPSFAAKLGIKGSLAELCQSKIVKEAILEDLQKIGKENGLKSFEQVKNIFVHPEPFSIENGLLTPTLKAKRGHLTKCFQTQIDSLYESIQE +>XP_004865452.1_PREDICTED:_ceramide_synthase_4 +MLSALNNLVWHERIWLPPSKTWTDMEDQDGMVLAHPRDILVALPLILMLVTARLAFDRFIGMPASRWLGMRDPTRKQVKPNPTLEKYFLQKGQKPEEAQVALLAAQCGLTLQQTQHWFRRRRNQDRPHMSKKFCEASWRFLFYLSTSISGILVLYPEPWLWDVAESWRNYPSQHLKPALSWWYLTELSYYSSLLLRLPFDVKRKDFKEQVMHHFVAVFLIFFSYGANLVRIGSLVLLLHDFGDCLLEACKVLNYMRLSLTCDILFFIFASVFFYTRLILMPTTIIYSVYYDSMKQFTPFFGYYFFLTLLVSLNMLHVYWFSLILRMLYNYLVKGQMTKDIRSDSEESSSSTDEAAPGHPQLKNGMACRPGPALAGSRRSRAKGQLANGHTAAT +>XP_012920615.1_PREDICTED:_heterogeneous_nuclear_ribonucleoprotein_H_isoform_X1 +MMLGTEGGEGFVVKVRGLPWSCSADEVQRFFSDCKIQNGAQGIRFIYTREGRPSGEAFVELESEDEVKLALKKDRETMGHRYVEVFKSNNVEMDWVLKHTGPNSPDTANDGFVRLRGLPFGCSKEEIVQFFSGLEIVPNGITLPVDFQGRSTGEAFVQFASQEIAEKALKKHKERIGHRYIEIFKSSRAEVRTHYDPPRKLMAMQRPGPYDRPGAGRGYNSIGRGAGFERMRRGAYGGGYGGYDDYNGYNDGYGFGSDRFGRDLNYCFSGMSDHRYGDGGSTFQSTTGHCVHMRGLPYRATENDIYNFFSPLNPVRVHIEIGPDGRVTGEADVEFATHEDAVAAMSKDKANMQHRYVELFLNSTAGASGGAYEHRYVELFLNSTAGASGGAYGSQMMGGMGLSNQSSYGGPASQQLSGGYGGGYGGQSSMSGYDQVLQENSSDFQSNIA +>XP_012927576.1_PREDICTED:_beta-centractin_isoform_X3 +MEHGVVRDWNDMERIWQYVYSKDQLQTFSEEHPVLLTEAPLNPSKNREKAAEVFFETFNVPALFISMQAVLSLYATGRTTGVVLDSGDGVTHAVPIYEGFAMPHSIMRVDIAGRDVSRYLQLLLRKEGADFHTSAEFEVVRTIKERACYLSINPQKDEALETEKVQYTLPDGSTLDVGPARFRAPELLFQPDLVGDESEGLHEVLAFAIHKSDMDLRRTLFANIVLSGGSTLFKGFGDRLLSEVKKLAPKDVKIKISAPQERLYSTWIGGSILASLDTFKKMWVSKKEYEEDGPRAIHRKTF +>XP_004875286.1_PREDICTED:_olfactory_receptor_8H1-like +MGRWNSTSVPGFILMGLTDSAETHLLLSMPFLLIYLITVLGNAGMILIIRLDPQLHTPMYFFLTHLSFLDLSYSSVTTPKTLQSLLTSIKSISFLGCFTQMYFFILLAATECFLLSSMAYDRYVAICHPLHYPVIMSTRRCRALLTGSYVIGFIYCTAVVVSMSQLHFCNSNVIQHFFCDTSPVLALSCSDTSEVEIIIFISAGSNLVLNLITTSASYVFILSTILKINSTAGKKKAFSTCASHLLGVTIFYGTMIFTYLKPKTSYSLGKDQVASVFYTIVIPMLNPIIYSLRNKEVKNAAVRFMQKIAGSRQVK +>XP_012924166.1_PREDICTED:_ninjurin-2_isoform_X5 +MLDVALFMSNATRLKAVLEHGPSSHYYTALIALISISLLLQVVIGILLVVIARLNLNEVENQWRLNQLNNAATILVFITVVFNVFITAFGAQKPGFLAAGAARDPL +>XP_012925362.1_PREDICTED:_probable_palmitoyltransferase_ZDHHC16_isoform_X2 +MRGQRSLLLGPARLCLRLLLLLGYRRRCPPLLRGLVQRWRYGKVCLRSLLYNSFGGSETVVDAAFEPVYWLVDNVIRWFGVVFVVLVIVLTGSIVAIAYLCVLPLILRTYSVPRLCWHFFYSHWNLILIVFHYYQAITTPPGYPPQGRNDIATVSICKKCIYPKPARTHHCSICNRCVLKMDHHCPWLNNCVGHYNHRYFFSFCFFMTLGCVYCSYGSWDLFREAYAAIETYHQTPPPTFSFRERITHKSLIYLWFLCSSVALALGALTVWHAVLISRGETSIERHINKKERRRLQAKGRVFRNPYNYGCMDNWKVFLGVDTGRHWLTRVLLPSSHLPHGNGMSWEAPPWVTAHSASVMAV +>XP_004870331.1_PREDICTED:_guanine_nucleotide-binding_protein_subunit_alpha-13 +MADFLPSRSVLSVCFPGCVLTSGEAEQQRKSKEIDKCLSREKTYVKRLVKILLLGAGESGKSTFLKQMRIIHGQDFDQRAREEFRPTICSNVIKGMRVLVDAREKLHIPWGDDDNQLHGDKLMAFDTRAPMAAKGMVETGVFLQYLPAIRALWADSGIQNAYDRRREFQLGESVKYFLDNLDKLGEPDYIPSQQDILLARRPTKGIHEYDFEIKNVPFKMVDVGGQRSERKRWFECFDSVTSILFLVSSSEFDQVLMEDRLTNRLTESLNIFETIVNNRVFSNVSIILFLNKTDLLEEKVQIVSIKDYFLEFEGDPHCLRDVQKFLVECFRNKRRDQQQKPLYHHFTTAINTENIRLVFRDVKDTILHDNLKQLMLQ +>XP_004862734.1_PREDICTED:_beta-galactosidase-1-like_protein_2_isoform_X3 +MSTWSLRRRPGRTLGLLLLVLLSFLVLRRLDWSTLIPPWLRHQRLGLQAKSQNFILEDTTFWIFGGSIHYFRVPREYWRDRLLKMKACGLNTLTTYVPWNLHEPERGKFDFSGNLDLEAFVLLAAEVGLWVILRPGPYVCAEIDLGGLPSWLLQDPGMKLRTTYKGFTEAVDLYFDHLMSRVVPLQYKHGGPIIAVQVENEYGSYNRDPAYMPYVKKALEDRGIIELLLTSDNKDGLQKGVVHGVLATINLQSQQELQLLTTFLLSVQGNQPKMVMEYWTGWFDSWGSPHNILDSSEVLETVSAIVNAGSSINLYMFHGGTNFGFINGAMHFNEYKSDVTSYDYDAVLTEAGDYTAKYGKLRDFFGSRSGAPLPPPPDLLPKMAYEPIAPSFYLSLWDALKYMEKPIKSEKPINMENLPVNDGNGQAFGYTLYETTIASSGVLHGHVRDQGQVFVNTVSIGFLDYKTTKIVIPLIQGYTVLRILVENRGRVNYGNNIDDQRKGLIGNLYLNNSPLKNFRIYSLDMKKSFFQRFGTDKWSTLPEAPTFPAFFLGVLSVVPSPSDTFLKLECDVPFLALVVD +>XP_004865768.1_PREDICTED:_E3_ubiquitin-protein_ligase_UHRF1 +MWVQVRTMDGKETHTVDSLSRLTKVEELRRKIQELFHVEPGLQRLFYRGKQMEDGHTLFDYDVRLNDTIQLLVRQSLVLPSSQERDSELSDTDSGCCLGQSESDKSSTHGEGAADADSKAGLADKDVAETEQGLYKVNEYVDARDTNMGAWFEAQVVGVLRKVRMAEDKPCSSTTSPTPEENVIYRVKYDDYPENGVVTMQSHNVRARARTILKWHELEVGQVVMLNYNSDHPRERGFWYDAEICRKRETRTGRELYANIRLGDHSLHNCRIVFMDEVFKIERPGEAPPVVENPMRRKSGPSCKYCKDDPNKLCRICACHRCGGREAPDKQLMCDECDMAYHLYCLDPPLSSVPPPEEDWYCPDCRNEPSEVVLAGQRLRESKKKAKMASATSSSQRDWGKGMACVGRTKECTIVPSNHYGPIPGIPVGTMWRFRVQVSESGVHRPHVAGIHGRSNDGAYSLVLAGGYEDDEDNGNSFTYTGSGGRDLSGNKRTAGQSSDQKLTNTNRALALNCYAPINDKKGAESKEWRSGKPVRVVRNMKGGKHSKYAPAEGNRYDGIYKVVKYWPEKGKSGFLVWRYLLRRDDVEPGPWTKEGKDRTKKLGLTMQYPEGYLEALANRDKENKRAAEEQEDLSPSKKGKWKRKSAGQSGSQPQTTKKTKLEPYRLTAEQSNLIKADESNTKLWTEVLTALREGLFQVFLSKVEETFQCICCQELVFQPVTTVCQHNVCKDCLDRSFRAQVFSCPACRYDLGRGYAMQVNTALQTILSHFFPGYGSGR +>XP_004850463.1_PREDICTED:_paired_box_protein_Pax-7_isoform_X1 +MAGLPGAVPRMMRPAPGQNYPRTGFPLEVSTPLGQGRVNQLGGVFINGRPLPNHIRHKIVEMAHHGIRPCVISRQLRVSHGCVSKILCRYQETGSIRPGAIGGSKPRQVATPDVEKKIEEYKRENPGMFSWEIRDRLLKDGHCDRSTVPSVSSISRVLRIKFGKKEEDDEADKKEDDGEKKAKHSIDGILGDKGNRLDEGSDVESEPDLPLKRKQRRSRTTFTAEQLEELEKAFERTHYPDIYTREELAQRTKLTEARVQVWFSNRRARWRKQAGANQLAAFNHLLPGGFPPTGMPTLPPYQLPDSTYPTTTISQDGGSTVHRPQPLPPSTMHQGGLAAAAAAADTSSAYGARHSFSSYSDSFMNPGAPSNHMNPVSNGLSPQVMSILSNPSAVPPQPQADFSISPLHGGLDSASSISASCQRADSIKSGDSLPTSQSYCPPTYSTTGYSVDPVAGYQYGQYGQTAVDYLAKNVSLSTQRRMKLGEHSTVLGLLPVETGQAY +>XP_004834603.1_PREDICTED:_SLIT_and_NTRK-like_protein_3 +MMKPSIAEMLHRGRMLWIILLSTIALGWTTPIPLIEDSEEIDEPCFDPCYCEVKESLFHIHCDSKGFTNISQITEFWSRPFKLYLQRNSMRKLYTNSFLHLNNAVSINLGNNALQDIQMGAFNGLKILKRLYLHENKLDVFRNDTFLGLESLEYLQADYNVIKRIESGAFRNLSKLRVLILNDNLIPMLPTNLFKAVSLTHLDLRGNRLKVLFYRGMLDHIGRSLMELQLEENPWNCTCEIVQLKSWLERIPYTALVGDITCETPFHFHGKDLREIRKTELCPLLSDSEVEASLGIPHLSSSKENAWPTKPSSMLSSVHFTASSVEYKSSNKQPKPTKQPRTPRPPSTSQALYPGPNQPPIAPYQTRPPIPIICPTGCTCNLHINDLGLTVNCKERGFNNISELLPRPLNAKKLYLSSNLIQKIYRSDFWNFSSLDLLHLGNNRISYVQDGAFINLPNLKSLFLNGNDIEKLTPGMFRGLQSLHYLYFEFNVIREIQPAAFSLMPNLKLLFLNNNLLRTLPTDAFAGTSLARLNLRKNYFLYLPVAGVLEHLNAIVQIDLNENPWDCTCDLVPFKQWIETISSVSVVGDVLCRSPENLTHRDVRTIELEVLCPEMLHIAPTGASPAHSGDSHFVGSPTSVSPYELSPPGVPVPLSVLILSLLVLFFSAVFVAAGLFAYVLRRRRKKLPFRSKRQEGVDLTGIQMQCHRLFEDGGGGGGGSAGGGRPTLSSPEKAPPVGHVYEYIPHPVTQMCNNPIYKPREEEEVVASAGQDTGSAERGGPGTQAPGMGEVLLGSEQFAETPKETHSNYRTLLEKEKEWALAVSSSQLNTIVTVNHHHPHPHHSAVGGVPGVVGGAGGDLSGFRHHEKNGGVVLFPPGGGCGGGSMLLDRERPQPGPCAVGFVDCLYGTVPKLKELHVHPPGMQYPDLQQDARLKETLLFSAGKGFTDHQTQKSDYLELRAKLQTKPDYLEVLEKTSYRF +>XP_004836794.1_PREDICTED:_TBC1_domain_family_member_9B_isoform_X2 +MWLGPEEVLVAHALWVTERANPFFVLQRRRGHGKGGGLTGLLVGTLDVVLDSSARVAPYRILHQTQDSQVYWTVACGSSRKEITKHWEWLENNLLQTLSIFDNEEDIITFVKGKIHGIIAEENKSLQPQGDEDPGKFKEAELKMRKQFGMPEGEKLVNYYSCSYWKGRVPRQGWLYLTVNHLCFYSFLLGKEVSLVVQWVDVTRLEKNATLLFPESIRVDTRDKELFFSMFLNISETFKLMEQLANLAMRQLLDSGGFLEDKALPRPVRPHRNISALKRDLDARAKNECYRAMFRLPRDEHLDGHTGCTLWTPFNKLHNPGQMFISNNYICFASKEEDACHLIIPLREVTIVEKADSSSVLPSPLSISTKSKMTFLFANLKDRDFLVQRISDFLQKMPSKQPGSSSSRSLSLGGGRASTVGPAPESLPAPQELPETPTSPTSPLCSRLSFGAQDVPTVSQGLLKVFQRHPAMEDLGAKGAKEKAKEEAWDIHFFEYGRGMCMYRTATTRQLVLKGIPESLRGELWLLFSGAWNEMVTHPGYYTELVEKSTGKYSLATEEIERDLHRSMPEHPAFQNELGIAALRRVLTAYAFRNPTIGYCQAMNIVTSVLLLYGSEEEAFWLLVALCERMLPDYYNTRVVGALVDQGIFEELTRDFLPQLSEKMQDLGVISSISLSWFLTLFLSVMPFESAVVIVDCFFYEGIKVILQVALAVLDANMEQLLDCSDEGEAMTVLGRYLDNVVNKQSISPPIPHLHALLTSGDEPPVEVDVFDLLKVSYEKFSSLRADDLEQMRFKQRLKVIQSLEDTAKRSVVRAIPGDIGFSIEELEDLYVVFKAKHMESQYWGSSRTAAAGHRDPSLPYLEQYRIDASQFQELFTSLTPWACGSHTPVLAGRMFRLLDQNRDLLINFKEFVTGMSAMYHGDLTEKLKALYKLHLPPALSPEEAESALEATHYFTEDSSSEEALPQEEREGNGNEDARGKKREEKGTSPPDYRHYLRVWAKEKEAPKETIKDLPKMNQEQFIELCKTLYSMFSEDPLEQGLYHAIATVASLLLRIGEVGKKLSAQSGRKPRGGAHAGDHSSAAEEDEPRTPGPPQDPTRAFQPPAAEDWRASAGGDTHEGKAAQESRAAAEGGSGGGRGSDDDTKDSMSMSSYSVVSTGSLQCEDLTDDTVLVGGEAHGPSASSRARGTVDADWCISFEQILASILTESVLVNFFEKTVGISTKIKDQKVVERQLSTSSEQEQSGASG +>XP_012931822.1_PREDICTED:_sarcoplasmic/endoplasmic_reticulum_calcium_ATPase_1_isoform_X3 +MGKVYRADRKSVQRIKARDMVPGDIVEVAVGDKVPADIRILSIKSTTLRVDQSILTGESVSVIKHTDPIPDPRAVNQDKKNMLFSGTNIAAGKAVGIVATTGVNTEIGKIRDQMAATEQDKTPLQQKLDEFGEQLSKVISLICVAVWLINIGHFNDPVHGGSWFRGAIYYFKIAVALAVAAIPEGLPAVITTCLALGTRRMAKKNAIVRSLPSVETLGCTSVICSDKTGTLTTNQMSVCKMFIVDKVDGDICLLNEFSITGSTYAPEGEVMKNDKPVRAGQYDGLVELATICALCNDSSLDFNEAKGVYEKVGEATETALTTLVEKMNVFNTDVRSLSKVERANACNSVIRQLMRKEFTLEFSRDRKSMSVYCSPAKSSRASVGNKMFVKGAPEGVIDRCNYVRVGTTRVPLTGPVKEKILSVIKEWGTGRDTLRCLALATRDSPPKREEMVLDDSSKFMEYEMDLTFIGVVGMLDPPRKEVTGSIQLCRDAGIRVIMITGDNKGTAIAICRRIGIFSESEEVTDRAYTGREFDDLPLAEQRDACRRACCFARVEPSHKSKIVEYLQSYDEITAMTGDGVNDAPALKKAEIGIAMGSGTAVAKTASEMVLADDNFSTIVAAVEEGRAIYNNMKQFIRYLISSNVGEVVCIFLTAALGLPEALIPVQLLWVNLVTDGLPATALGFNPPDLDIMDRPPRSPKEPLISGWLFFRYMAIGGYVGAATVGAAAWWFLYADDGPHVSYYQLTHFMQCTEHNAEFGGLDCEVFEAPEPMTMALSVLVTIEMCNALNSLSENQSLVRMPPWVNVWLLGSICLSMSLHFLILYVDPLPMIFKLQPLTVTQWLMVLKISLPVIGLDEILKFVARNYLEG +>XP_004875135.1_PREDICTED:_trace_amine-associated_receptor_1-like +MMLVCHSVMNISCVESSRSHDVRVSLYSLMVIIILTTLVGNLIVIISISHFKQLHTPTNWLIHSMALVDFLLGCLVMPYSMVRSVEHCWYFGEIFCKIHTSTDIMLSSASIFHLSFISIDRYYAVCDPLRYKARMNIWVTFVMIFISWSVPALLAFGMIFMELNIKGAEEMYCKHIYCKGGCAVFFSKITGVLAFMISFYIPGSIMLCVYCRIYFIAKGQARSIKGTSQKLQTGLEERNGISQSKERKAATTLGIVLGVFLICWCPFFVCTIMDPFLNYTIPLALNEALIWFGYLNSTFNPMVYAFFYPWFRRALKIILFGKIFQKDSSRCKVFLDSNP +>XP_004871904.1_PREDICTED:_type_III_endosome_membrane_protein_TEMP_isoform_X1 +MSSGPFMREANQTHMGPSELPTASAMAPEPGTAGRAWPVLVGVVLGAVVLSVIIALAAKCHLCRRYRASFQHHQLSRTGSENHPEVGEEDDDGFIEDNYIQPGAGELETEGSRDHFPL +>XP_004870529.1_PREDICTED:_nuclear_receptor_subfamily_2_group_C_member_2_isoform_X2 +MTSPSPRIQIISTDSAVASPQRIQIVTDQQTGQKIQIVTAVDASGSSKQQFILTSPDGAGPGKVILASPETPSPKQLIFTTSDSLVPGRIQIVTDSASVERLLGKAEVQRPQVVEYCVVCGDKASGRHYGAVSCEGCKGFFKRSVRKNLTYSCRSSQDCVINKHHRNRCQFCRLKKCLEMGMKMESVQSERKPFDVQREKPSNCAASTEKIYIRKDLRSPLIATPTFVAEKDGASRQPGLLDPGMLVNIQQPLIREDGTVLLATDSKAETSQGALGTLANVVTSLANLSESLNNGDTSDIQPEDQSASEITRAFDTLAKALNTADGTSPPSLADGLDASGGGGIHVISRDQSTPIIEVEGPLLSDTHVMFKLTMPSPMPEYLNVHYICESASRLLFLSMHWARSIPAFQALGQDCNTSLVRACWNELFTLGLAQCAQVMSLSTILAAIVNHLQNSIQEDKLSGERVKQVMEHIWKLQEFCNSMARLEIDGYEYAYLKAIVLFSPDHPGLTGTSQIEKFQEKAQMELQDYVQKTYSEDTYRLARILVRLPALRLMSSNITEELFFTGLIGNVSIDSIIPYILKMETAEYNGQITGASL +>XP_004862313.1_PREDICTED:_transmembrane_protein_9 +MKLLSLVAVAGCLLVPPAQAYKSSEDIRCKCICPPYRNISGHIYNQNVSQKDCNCLHVVEPMPVPGHDVEAYCLLCECRYEERSTATIKVIIVIYLSVVGALLLYMAFLMLVDPLIRKPDAYTEQLHNEEENEDARSMAATASSLGGPRANTVLERVEGAQQRWKLQVQEQRKTVFDRHKMLS +>XP_004839092.1_PREDICTED:_protein_odd-skipped-related_1 +MGSKTLPAPVPIHPSLQLTNYSFLQAVNGLPTVPSDHLPSLYGFSALQAVHLHQWTLGYPAMHVPRSSFSKVPGAVSSLVDARFQLPAFPWFPQVIQPKPEIAAAGSGPALKSKPRFDFANLALAATQEDPSKLVRGEGPGSPTGGLGALLDVTKLPPEKKPTRGRLPSKTKKEFVCKFCGRHFTKSYNLLIHERTHTDERPYTCDICHKAFRRQDHLRDHRYIHSKEKPFKCQECGKGFCQSRTLAVHKTLHSQVKELKTPKIKC +>XP_012925113.1_PREDICTED:_LOW_QUALITY_PROTEIN:_regulatory_solute_carrier_protein_family_1_member_1-like +MSSLPTSDGFTHPAHSSGPSPEIGNPMSLAHSAFASVCPIKLSDPDSIQPKAVKALKASVEFQMNSKKKELLPLQDPSDHVSSADQSPAMPLHNSSEEAVIRDNLEKFAERSSQGXLHTRQGASLSVTTAXMHEPLMLVDKKCWHPENQNLHQLNGLHQHTEPGNKQHEVQQNAPHDQGHLCDLGDIQLPEEKQQDQQKIVDLKASMKEEGLQQNSDLPSPEKSFLPSGCFGSSNSEMLMEIEVVEQSIVSVLKSTCSQNANVENIGVSSLTSDNPLMEVETSKCNPSSASVNNSISTQNLQXPESNIEMSGTNNEYGNSLPTLSLCGSCQPSVESTEESCSSVTAALKELHELLVSSSKPAPENTSKVICQSETIPEGQKGVKDFSERWTQNDHLPHREPCPQVFCHQASSVSVKSESLGAVPGTGTEDTEDSSSQGPSDGLSADKDGVPRSTESVSESSSVTITSAESSNQLHCTLGVEISPSLTASEDALSQTSEQTESLPSSFILVKDLGHGIQNLATDRPETRENACPDTARPFLELDPLTSHLSSPSLLSPLIFPATDIDRILWAGFTLQEALGALHRVGGNADLALLVLLAKNIVVAT +>XP_004850674.1_PREDICTED:_aurora_kinase_A_and_ninein-interacting_protein_isoform_X2 +MLTLLPRERKPVSFTQRRIPSAGIKQTSIASFTLKTGMTDVGNQSSVSSHTESQINKESKTDTTQLDCLIRDSEDDCIAPPLAMSTPEDIQETGLSPWSHKTSGHYNVRSPFLTMPQPNSLVCAGDSKASLAFSCLLDQKDSSRKKEWFYGSEKNYQGMERHIRPPGGKCHQLLDKAKSERKVSVKENRQRSVHLQTFRESWSRENTESVKQNRCPVSVFSWDSEKNDKESWSQLFTEDSQGQRVIAHRRAPFQDVSNTWHQGLGHFPTSPRAESQAGHTQLNLQPDLLLTQDSEGNQVIRHQF +>XP_012932632.1_PREDICTED:_nuclear_factor_of_activated_T-cells,_cytoplasmic_2_isoform_X2 +MDAPEPKCDPDGRNAPGHEPAGSPQDEFDFSILFDYDYVNPFEEEPNAHKVASPPSGLAYPDDVPDCGLQPYSPLASLSGEPPGRFGEPDRLGPQNFLSPAKPAGASGLSPRIEITPSHELIQAGVPLRMRDAGLLLEQPALAGVAASPRFTLPVPGFEGYREPLCLSPASSGSSASFISDTFSPYTSPCVSPNNGGGPDDLCPQFQNIPAHYSPRTSPIMSPRTSLAEDSCLGRHSPVPRPASRSSSPGAKRRHSCAEALVAPLPGASPQRSRSPSPQPSSHVAPRDDGAPAGYPPTAGSAVLMDALNSLATDSPCGIPPKVWKTSPDPSPVSAAPAKAGLPRHIYPAVEFLGPCEQEDRRNSAPESILLVPPTWPKQLVPAIPICSIPVTASLPPLEWPLSNQSGSYELRIEVQPKPHHRAHYETEGSRGAVKAPTGGHPVVQLHGYMENKPLGLQIFIGTADERILKPHAFYQVHRITGKTVTTTSYEKIVGNTKVLEIPLEPKNNMRATIDCAGILKLRNADIELRKGETDIGRKNTRVRLVFRVHIPESSGRIVSLQTASNPIECSQRSAHELPMVERQDIDSCLVYGGQQMILTGQNFTAESKVVFTEKTTDGQQIWEMEATVDKDKSQPNMLFVEIPEYRNKHIRTSVKVNFYVINGKRKRSQPQHFIYLPVPAVKTEPSDEYDPSLICSPAHGGLGSQPYYPQHPMVAESPSCLVATMAPCQQFRSGLSSPDARYQQQNPAAVLYQRSKSLSPSLLGYQQPALMAAPLSLADAHRSVLVHTGSQGQNPALLHPTPANQQASPVIHYSPTNQQLRCGSHQEFQHIMYCENFAPGTARPGLPPVSQGQRLSPGSYPTVIQQQNAPSQRAAKNGPPVSEQKEVLPTGVTIKQEQNLDQTYLDDELIDTHLSWIQNIL +>XP_012923780.1_PREDICTED:_glycosylphosphatidylinositol-anchored_high_density_lipoprotein-binding_protein_1 +MKALEAVVLALLLCGQPGSRQAQEEEEEDDRRPESYGYDEEEEEEEEETNMITGSRDRALQCYACPLLHHGESCDQMQSCSGSRASCIMLVTHGNTDSGLLTTYSMWCTDSCQPIIKTVEGTQMTETCCQSPMCNVPPWQHPQVQDPLNGKAGSPQDSRAGHPQSNGSCSLSSCPQHVSTALLLSLLTSLLAVRA +>XP_004853488.1_PREDICTED:_methyltransferase-like_protein_13_isoform_X3 +MNLLPKSSKEFGSVDYWEKFFQQRGKQAFEWYGTYLELCGVLHKYIKPREKVLVIGCGSSELSGQLYDVGYQDMVNIDISEVVIKQMRERNARRRPQMSFLKMDMTRMEFPDASFQVVLDKGTLDAVLTDEEEKTLQLVDRMLAEIGRVLQVGGRYLCISLAQAHVLKKAVGHFSREGWMVRVHQVASSQDQALESEPRFSLPVFAFVMTKFRPVPGSALQIFELCAQEQGKPVRLESAERLAEAVQERQQYAWLCGQLRCKAGLGSVSLDLCSGDTGEPRYTLHVVDSPAVKPSRDNRFAIFIIPQGRETEWLFGMEEGRKQLAASAGFRRLITVALHRGQQYDSMDSIQAELSARVMELAPAGMPAQQQVPFLSVGGDIGVRTVQHQDCSPLSGDYVIEDVQGDDRRYFRRLIFLSNRNVVQSEARLLKDVPHRAQKKRKKDKKKQWPVETSEDLPPAPEQSIDKSYLCCEHHKAMIAGLALLRNPELLLETPLALLVVGLGGGSLPLFVHDHFPKSYVDAVEIDPSMLEVATQWFGFSQSDRMKVHIADGLDYISSLAGGEARTHYDVIMFDADSKDPALGMSCPPPGFVDRPFLQKVKSILTQEGELKEK +>XP_004852439.1_PREDICTED:_ribonuclease_H2_subunit_C_isoform_X2 +MESGDESAMEKQRVHVRPATLHDSSPATLHLLPCEVLANRFAPVGRFFTPAIRQGADGLHVSFRGRSLRGEEVSVPPGLTGYVMVTEKREGLIGKQDFRGSENNGEEAQEPLERGFDQFIGATGSFSCFTVWGLETVPGPEAKVWGALTWPTLAAAIHAQVPED +>XP_012930631.1_PREDICTED:_sorbin_and_SH3_domain-containing_protein_2_isoform_X12 +MNTDSGGCARKRAAMSVTLTSVKRVQSSPNLLAAGRDSQSPDSAWRSYNDRIQETLNGDATYSSLAAKGFRSVRPNLQEKKSPTQAPLPPARKESFCSSLITSHTQGDILDSSETNTQTPSCTEFLTNKKPLPGTMHSNEDSNSTIIYSEESNTTVSYTQKIANPLPGASSTSPAPFANINTPFLQENYMQDSQTQRISTLKLTHNQDLGSTIPFHIPRFSNPVEVPSFLKKTCSPPPKPVPEVHTASLSIQIAPLSGQDPESHKQLPELSPETTKIPLQQERQKSAVAATSQSSDCRSGNQHLTANVLEVNASQTHRQTTSEAASSCHSPVIPFNQTTFSPGSGFSPVSAPDDLGPSGLYKPQGFPHCLYKYPTPALERLIHSQDTGSLRTDSSLSESESSTAILVELQMGNSDTTDCSETPSPASGQRSAVTDGTILTTPAATHSQITVNGNSGGAVSPMSYYQRPFSPSAYSLPGSLNSSLIMQHGRSLDSSETYSQHAQSLDGTTGSSIPLYRSSEEEKRVTVIKAPHYPGIGPVDESGIPTAIRTTVDRPKDWYKTMFKQIHMVHKPDDDTDMYNTPYTYNAGLYNAPYSAQSHPAAKTQTYRPLSKSHSDNGTDAFKEASSPVPPPHVPPRPRDRSSTEKHDWDPPDRKVDTRKFRSEPRSIFEYEPGKSSILQHERPASIYQSSIDRSLERPSSSASMASDFRKRRKSEPAVGPPRGLGDHIARRTSPSRADLPGSSTTLTKSLISSSPSSPSRAKDRESPRSYASTLTDLGRSAPRERRGTPEKEKLPAKAVYDFKAQTSKELSFKKGDTVYILRKIDQNWYEGEHYGRVGIFPISYVEKLTPPEKAQPARPPPPAQPGEIGEAIAKYNFNADTNVELSLRKGDKIILLKRVDQNWYEGKIPGTNRQGIFPVSYVEVVKKNTKGAEDYPEPPIPHSYSSDRIHSLSSNKPQHPVSTHENIQGGGEPFQALYNYTPRNEDELELRESDVIDVMEKCDDGWFVGTSRRTKFFGTFPGNYVKRL +>XP_004853054.1_PREDICTED:_interferon_regulatory_factor_2_isoform_X2 +MPVERMRMRPWLEEQINSNTIPGLKWLNKEKKIFQIPWMHAARHGWDVEKDAPLFRNWAIHTGKHQPGVDKPDPKTWKANFRCAMNSLPDIEEVKDKSIKKGNNAFRVYRMLPLSERPSKKGKKPKTEKEDRVKHIKQEPIESSLGLSNGVSDLSPEYAVLTSAIKNEVDSTVNIIVVGQSHLDSNIEDQEIVTNPPDICQVVEVTTESDEQPVSMSELYPLQISPVSSYAESETTDSVPSDEESAEGRPHWRKRNIEGKQYLSNMGTYPLPGMVTFVTSNKPDLQVTIKEESSPMPYSTSWPMLSDLSLPASVTPMPSSSRPDRETRASVIKKTSDITQPRVKSC +>XP_004842780.1_PREDICTED:_ubiquitin_carboxyl-terminal_hydrolase_10_isoform_X1 +MIAGGRPHFITLCPPRLSAWSVVPTCCPGLEAFLSFLLQVEQNTLPPYSGTALCGTQAADELPDGQEYQRIEFGVNEVIDPSDTLPRAPGNSISSTLNPQAPEFILGCTASKKTPDGLDQEVNSSSLDHPYPGPALALDSSSHAEAEALENTGGPGGLGQRERKRKKKRPPGYYSYLKTGGDESISTEAVVNGHANSAGLGGVGAEDAEFMGDMLPPVSPRTCDSPQNSTDFISDTVPDSPYPGALDSAARTVGQPEGCCGPDFEQACLPADRLLRTAVAPPCAATDTTENLGITNGQVLESSSVGTAANGELHTVESTDSDVAKLERAPPPADSVLPAPIPINQPAKSWASLFHDAKPSSSSPVAYVETKCSPPAPSPLVSEKQVEVKEGLVPVSEDPVAMQIAELLENVTLVHKPVSLQPRGLINKGNWCYINATLQALVACPPMYHLMKFIPLYSKVQRPCTSTPMIDSFVRLMNEFTNMPVPPKPRQALGDKIVRDIRPGAAFEPTYIYRLLTVIKSSLSEKGRQEDAEEYLGFILNGLHEEMLSLKRLLSPDSEKLTVSNGPRSPLPKDAAQQEQGEGSEEEWEQVGPRNKTSVTRQADFVQTPITGIFGGHIRSVVYQQSSKESATLQPFFTLQLDIQSDKIRTVQDALESLVARESVQGYTTKTKQEVEISRRVTLEKLPPVLVLHLKRFVYEKTGGCQKLAKNIDYPVDLEISRELLSPGVKNKNFKCHRTYRLFAVVYHHGNSATGGHYTTDVFQIGLNGWLRIDDQVVKVIQQYQVLKPAAERTAYLLYYRRVDLL +>XP_004850280.1_PREDICTED:_39S_ribosomal_protein_L13,_mitochondrial +MSSFSRASQQWATFARMWYLLDGRMQPPGKLAAVASVKLQGLHKPVYHQISDCGDHVVIMNTRHIAFSGNKWEQKVYSSHTGYPGGFQQVTAIQLHLRDPVAIVKLAVYGMLPKNLHRRTMMQRLHLFPDEDIPEDLLRNLVEELPQPRKVPQRLDEYTQEEREAFPRVWSPPEDLRL +>XP_004858742.1_PREDICTED:_kelch_domain-containing_protein_9_isoform_X3 +MAAAAAPGGRAGGSGWTWRPVACDALLARAFHSSTELGGRFYLVGGLLAGGATAPSSDTVLFDPAGAQAVRLGAQGSAPRSHHDAAPVDGRWLCIVGGWDGSRRLAAVAALDTERGAWEEWKAAPGNCPPAGLSSHTCTRLSDRELLVAGREGGVRTQRRYGNIYALKLDPGARTYCYKEEGCRTSSRSGHSAALIQTPGPHPGHQLLLFGGCNSAEPEVAGQWSHGKIKSPFFLPQGAATCCPSLDRTACKACKQWKGGSTGAPWTAASLLFCGGALCCAIWWRKSDQS +>XP_012925095.1_PREDICTED:_double-strand_break_repair_protein_MRE11A_isoform_X3 +MGDRPVQFEIISDQSVNFGFSKFPWVNYQDGNLNISIPVFSIHGNHDDPTGADALCALDILSCAGFINHFGRSMSVEKIDISPVLLQKGSTKIALYGLGSIPDERLYRMFVNKKVTMLRPKEDESSWFNLFVIHQNRSKHGSTNFIPEQFLDDFIDLVIWGHEHECKIAPTKNEQQLFYVSQPGSSVVTSLSPGEAVKKHVGLLHIKGRKMNMQKIPLQTVRPFFMEDVVLANHPNIFNPDNPKVTQAIQSFCLEKIEEMLENAERERLGNSQQPEKPLLRLRVDYSGGFEPFNIHRFSQKFVDRVANPKDIIHFFRHREQKEKTGEEINFGKLITKPSEGTTLRVEDLVKQYFQTAEKNVQLSLLTERGMGEAVQEFVDKEEKDAIEELVKYQLEKTQRFLKERHIDALEDKIDEEVRRFRESRQKNTSEEDDEVREAMSRARALRSQSEDSASAFSADDLMSMDLAEQMANDSDDSISTAPSRGRGRGRGQRGGRGQNLAPRGGSQRGRAGTGLNTFTRSRSSRTTVSTSRNMSILDAFKSSRQQPSRNVATKNYSEVIEVDESDEEEDIFPTTSKTDQRWSSISASKPTSQSQIAKGIDFESEEEDDDDPFMSINSLRRNRR +>XP_012926282.1_PREDICTED:_regulator_of_telomere_elongation_helicase_1_isoform_X9 +MPKIVLNGVTVDFPFQPYQCQQEYMSKVLECLQKKVNGILESPTGTGKTLCLLCTTLAWREHLWDTVSARKIAERAQGELFLDQALSAWGSATAADGEPIACYTDIPKIIYASRTHSQLTQVINELRNTAYRPRVCVLGSREQLCIHPEVKKQESNHMQIHLCRKKVASRSCHFYNNVEEKSLEQELVTPILDIEDLVKNGSKHKVCPYYLSRNLKQQADIIFMPYNYLLDAKSRKAHNIDLKGTVVIFDEAHNVEKMCEESASFDLTPHDVASGLDAIGQVLEEQTRVVQQSELQLGLSLDPTSSGLNMQLEDIAKLKMILLRLEGAIDAVQLPGDGSGVTKPGSYIFNLFAEAQITFQSKVCILESLDQIIQHLAGRAGVFTNTAGLQKLMDIIQIVFSVDPTEGSPGISQSYKVHIHPDIGPRRAAQRSDAWSAAASRKQGKVLSYWCFSPGHSMQELLRQGVRTVILTSGTLAPLSSFVLEMQIPFPVCLENPHVIDKHQLWVGVIPRGPDGAELSSAFDKRFSEECLSSLGKTLGNIARVVPHGLLVFFPSYPVMENSLAFWRARDLARKVEVLKPLFVEPRSKGSFSEVIDAYYQRVASPGSSGATFLAVCRGKASEGLDFSDINGRGVIITGLPYPPRMDPRVVLKMQFLDEMRGQSQAGGQFLSGQEWYRQQASRAVNQAIGRVIRHRHDYGAIFLCDHRFTYADAKAQLPSWVRPYLKVYNNFGHVIRDVAQFFRVAQRTMPAPVPRALAPGVGEGKAAAKVTTLPGPLLATRKATSLDVHVPSLRQKPAGSPAVEDPESNLCVEYEQEPVTAPWRPMGLLAALEHSEQKAGAPEDEAYPGKEAVGRSTLSLQCEKRLADEQRGGRKKVRLVSHQEKPEAGTQEERAKLFMVAVKQTLSQASFDTFTQALKVYKGSDDLKALMDCLSCLFAEDPKKHTLLQGFYQFVRPHHKQQFKDICIQLTGQGCSSWPEPGLSHRQQALPALGPSGPQEHVSSGKRGPEPTLTQSKEVAKQLDPGVHLNQGDTHSCPEVWSTVEQGQSAASAYLADIREALGCAAHRQLLAALKVYKQDDNFDKVLAVLAALTTARPEDLPLLQRFSMFVRPHHKQHFLQTCADLMGLPASGRELGPLEESPTTPELSHGAPQSGPSLLQRPRRVQSKIFSFLKQTPDDGL +>XP_012931552.1_PREDICTED:_set1/Ash2_histone_methyltransferase_complex_subunit_ASH2_isoform_X5 +MAAAGTGLGSGAGAGPGSGAAANAITAEDGETKPVAAIAAAPAGEGASTAPTPAEPSSGEAESRDANLVDVSGGLETESSNGKETLEGAGDTSEAMDTQAGSVDEENGRQLGEVELQCGICTKWFTADTFGIDTSDLKIIIRSENEKLLILGIFPAASRSCLPFMTNYSFHCNICHHSGNTYFLRKQANLKEMCLSALANLTWQSRTQDEHPKTMFSKDKDIIPFIDKYWECMTTRQRPGKMTWPNNIVKTMDLSNIGPAYDNQKQSSAVSTSGNLNGGATFGGGITAGSSGKGRGAKRKQQDGGTTGTTKKARSDPLFSAQRLPPHGYPLEHPFNKDGYRYILAEPDPHAPDPEKLELDCWAGKPIPGDLYRACLYERVLLALHDRAPQLKISDDRLTVVGEKGYSMVRASHGVRKGTWYFEITVDEMPPDTAARLGWSQPLGNLQAPLGYDKFSYSWRSKKGTKFHQSIGKHYSSGYGQGDVLGFYINLPEDTETAKSLPDTYKDKALIKFKSYLYFEEKDFVDKAEKSLKQTPHSEIIFYKNGVNQGVAYKDIFEGVYFPAISLYKSCTVSINFGPCFKYPPKDLTYRPMSDMGWGAVVEHTLADVLYHVETEVDGRRSPPWEP +>XP_012926364.1_PREDICTED:_kynurenine--oxoglutarate_transaminase_3_isoform_X5 +MSSKLKNAKRIEGLDSNVWVEFTKLAADPSVVNLGQGLPDISPPTYVKEELSKIALVDNLNQYTRGFGSDLGPCPCAADGKTTELNPRPCPFSLESSCLSSVTTAVLTVSGHPSLVKALSCLYEKFYQNQIDPNKEILVTVGAYGSLFNAIQGLIDEGDEVIIIVPFYDCYEPMMRMAGATPVFIPLRSKAVCGKKWSSSDWTLDPQELESKFNSKTKAIILNTPHNPLGKVYTKEELQLIAHLCIKYDTLCISDEVYEWLVYTGNKHLKIATFPGMWERTVTIGSAGKTFSVTGWKLGWSIGPHHLIKHLQTVQQNTIYTCATPLQEALAQALWIDIKRMDDPECYFNSLPKELEVKRDRIVHLLESVGLKPIVPDGGYFIIADVSSIDADLSDMMNNEPYDYKFVKWMTKNKKLAAIPVSAFCNSETKSQFEKFVRFCFIKKDSTLDAAEEIIKTWNRQRSQSGQNV +>XP_004839687.1_PREDICTED:_dedicator_of_cytokinesis_protein_4_isoform_X4 +MWIPTELEKYGVVIASFRGTIPHGLSLEIGDTVQILEKCDGWYRGFALKNPNIKGIFPSSYVHLKNACVKNKGQFEMVIPTEDSVITEMTSTLRDWGTMWKQLYVRNEGDLFHRLWHIMNEILDLRRQVLVGHLTHDRMKDIKRHITARLDWGNEQLGLDLVPRKEYAMVDPEDISITELYRLMEHRHRKKDTPVQASSHHLFVQMKSLMCSNLGEELEVIFSLFDSKENRPISERFFLRLNRNGLPKAPDKPERHCSLFMDLGSSELRKDIYITVHIIRIGRMGAGEKKNACSVQYRRPFGCAVLSIADLLTGETKDDLVLKVYMCNTESEWYQIHENIIKKLNARYNLTGSNAGLAVSLQLLHGDIEQIRREYSSVFSHGVSITRKLGFSNIIMPGEMRNDLYITIERGEFEKGGKSVARNVEVTMFIVDSSGQTLKDFISFGSGEPPASEYHSFVLYHNNSPRWSELLKLPIPVDKFRGAHIRFEFRHCSTKEKGEKKLFGFSFVPLMQEDGRTLPDGTHELIVHKCEENTNLQDTTRYLKLPFSKGIFLGNNNQAMKATKESFWITSFLCSTKLTQNGDMLDLLKWRTHPDKITGCLSKLKEIDGSEIVKFLQDTLDTLFGILDENSQKYGSKVFDSLVHIINLLQDSKFHHFKPVMDTYIESHFAGALAYRDLIKVLKWYVDRITEAERQEHIQEVLKAQEYIFKYIVQSRRLFSLATGGQNEEEFRCCIQELLMSVRFFLSQESKGSGALSQSQAVFLSSFPAVYSELLKLFDVREVANLVQDTLGSLPTIMHVDDSLQAIKLQCIGKTVESQLYTNPDSRYILLPVVLHHLHIHLQEQKDLIMCARILSNVFCLIKKNSSEKSVLEEIDVIVASLLDILLRTILEITSRPQPSSSAMRLQFQDVTGEFVACLLSLLRQMTDRHYQQLLDSFNTKEELRDFLLQIFTVFRILIRPEMFPKDWTVMRLVANNVIITTVLYLSDALRKNFLNENFDYKIWDSYFYLAVIFINQLCLQLEMFTPSKKKKVLEKYGDMRVTMGCEIFSMWQNLGEHKLHFIPALIGPFLEVTLIPQPDLRNVMIPIFHDMMDWEQRRSGNFKQVEAKLIDKLDSLMSEGKGDETYRELFNSIIPLFGPYPSLLKKIERETWRESGVSLIATVTRLMERLLDYRDCMKMGEVDGKKIGCTVSLLNFYKTELNKEEMYIRYIHKLYDLHLKAQNFTEAAYTLLLYDELLEWSDRPLREFLTYPMQTEWQRKEHLHLTIIQNFDRGKCWENGIILCRKIAEQYESYYDYRNLSKMRMMEASLYDKIMDQQRLEPEFFRVGFYGKKFPFFLRNKEFVCRGHDYERLEAFQQRMLNEFPHAIAMQHANQPDETIFQAEAQYLQIYAVTPMPESQEVLQREGVPDNIKSFYKVNHIWKFRYDRPFHKGTKDKENEFKSLWVERTSLYLVQSLPGISRWFEVEKREVVEMSPLENAIEVLENKNQQLKTLISQCQTRQMQNINPLTMCLNGVIDAAVNGGVSRYQEAFFVKEYILSHPEDGEKIARLRELMLEQAQILEFGLAVHEKFVPQDMRPLHKKLVDQFFVMKSSLGIQEFSACIQASPVHFPNGSPQVCRNSAPASMSPDGTRVIPRRSPLSYPAVNRYSSSSLSSQASAEVSNITGQSESSDEVFNMQPSPSTSSLSSTHSASPNVTSSAPSSARASPLLSDKHKHSRENSCLSPRERPCSAIYPTPGEPSQRMLFNHIGDGGASPRSDPNLSAPEKASPARHTTAVSPSPAGRSPLKGSVQSFTPSPVEYHSPGLTSNSPVLSGSYSSGISSLSRCSMSETSGFENQVNDQPAPATVPGYSGPEEPARKESKTPPPYSVYERTLRRPVPLPHSLSIPVTPEPPALPPKPLAARAGHLENGTRRTEPGPRPRPLPRKVSQL +>XP_012927884.1_PREDICTED:_extensin-like +MLVVPLTAALLALSSAQSSYKGRGEGCELSGPPPPGNQQGPPQQGGPQNHSPHSINKQGPPRPGPQQPNGLPPPPLPPGKPQSPPPPEGPQNRPPHSLYKQGPPLPGGPQQPNRPPDTGNQQGPPQEEGLGFFISYLYFSTVHDTYEMKNPNPKNQAHTPKVRYPYFSTIHDTFEMKNPNTKNHARNPNVRYLYFSKIQCTYENKNPNPKNRTHTPIVSAIPDTYEKKIPNPKENTHTPNVRYLYFSTVHDTYEMKSPKPKNHAHTPNVRYMKRKPKLKHNPNFNSNPKKQDQKPVTSTVHDTYKMKNPKSKNHAHTPNVRYLYFSTINDNFEKKNPNHDNHIHTANISYMN +>XP_012929119.1_PREDICTED:_sarcosine_dehydrogenase,_mitochondrial_isoform_X5 +MASLNRALLVATACPRWRPAQRLGLQALAGAAGPKAEKNVPYQRTLKEEAQGPGAASRGPSQPLPSTASVVVIGGGSVGCQTLYHLAKLGVAGAVLLERERLTSGTTWHTAGLLWQLRPSDVEVELLAHTRRVVSRDLEEETGMHTGWIQNGGLFIASSRQRLDEYKRLMSLGKAYGVESHVLSPAETKVLYPLMKVDDLYGTLYVPQDGTMDPAGTCSTLARAAVARGARVIENCTVTGIRVRTDDFGVRRVAAVETEHGSIQTPCVVNCAGVWAGAVGRMAGVKVPLVAMHHAYVVTERIEGIQNMPNVRDHDASVYLRLQGDALSVGGYEANPIFWEEVSDKFTFGLFDLDWDVFTQHIEGAINRVPVLETTGIKSTVCGPESFTPDHKPLMGEAPELRGFFLGCGFNSAGMMLGGGCGQELAHWVMHGRPEKDMYSYDIRRFHPSLTAHQRWVRERSHESYAKNYAVVFPHDEPLAGRNMRRSLLHEELLGQGCVFQERHGWERPGWFSPQGPAPVLEYDYYGAYRKRPHRDYAYARLLADEYTFSFPPQHHVGAEAPTQHQGPGRRGAPRSVLVPGNSGHPGPVAEKMSVSPGNRPRFPSPGHASSHAGCDVAALEGKVPSVPTLSPRLAPWLQSARVRETEAEALCLVSAAAVQGGPGCVWHLSSRCSESCAAPALRGAEARGRRQLGTGVSQPPQMCPRQPPARGARSLSVLAASPACRRRRQSQGWSAAQRAAVGPLAPGTRWVLGKGCQCLEGGCRGARAWASEGPRPGGCVHQLPGVGRPLAPPI +>XP_004873590.1_PREDICTED:_pre-rRNA-processing_protein_TSR2_homolog +MMAGAGEAVRTLFRAGVRVVLEAWPALKIAVENGFGGVHSQEKAEWLESAVEDYFICNADLELDEVEDFLEELMTNEFDTIVEDGSLPQVSQQLQTMFHHFQRGDGAALKEMASHITQRKCRATALKTARETNEDEDDADSVEEMEVTATNDVAALQPETSDSNSQTIKEEDIVEDGWTIVRRKK +>XP_004854472.1_PREDICTED:_calcium/calmodulin-dependent_protein_kinase_type_II_subunit_alpha_isoform_X1 +MATITCTRFTEEYQLFEELGKGAFSVVRRCVKVLAGQEYAAKIINTKKLSARDHQKLEREARICRLLKHPNIVRLHDSISEEGHHYLIFDLVTGGELFEDIVAREYYSEADASHCIQQILEAVLHCHQMGVVHRDLKPENLLLASKLKGAAVKLADFGLAIEVEGEQQAWFGFAGTPGYLSPEVLRKDPYGKPVDLWACGVILYILLVGYPPFWDEDQHRLYQQIKAGAYDFPSPEWDTVTPEAKDLINKMLTINPSKRITAAEALKHPWISHRSTVASCMHRQETVDCLKKFNARRKLKGAILTTMLATRNFSGGKSGGNKKNDGVKKRKSSSSVQLMESSESTNTTIEDEDTKVRKQEIIKVTEQLIEAISNGDFESYTKMCDPGMTAFEPEALGNLVEGLDFHRFYFENLWSRNSKPVHTTILNPHIHLMGDESACIAYIRITQYLDAGGIPRTAQSEETRVWHRRDGKWQIVHFHRSGAPSVLPH +>XP_004852280.1_PREDICTED:_calcium-binding_protein_2_isoform_X1 +MVQGPMGNCAKRPWRRGPKDPWQWPGSPRGGSCCSASPRPKEQGGVQGYSVLGSLVGPACIFLRPNIATTQLDRDLRPEELEELQVAFQEFDRDRDGYIGYRELGACMRTLGYMPTEMELIEISQQISGGKVDFEDFVELMGPKLLAETADMIGVRELRDAFREFDTNRDGCISLGELRAALKALLGERLSQREVDEILQDIDLNGDGLVDFEEFVRMMSR +>XP_004871914.1_PREDICTED:_elongation_of_very_long_chain_fatty_acids_protein_1_isoform_X1 +MRKWQAGWPWGLLSGPAPSEPSTAAHLAPAESLARMEAVVNLYQEMMKYTDPRIQNYPLMGSPLLMTSILLTYVYFVLSLGPRIMANRKPFQLRGFMIVYNFSLVALSLYIVYEFLMSGWLSTYTWRCDPVDYSNSPEALRMVRVAWLFLFSKFIELMDTVIFILRKKDGQVTFLHVFHHSVLPWSWWWGVNIAPGGMGSFHAMINSSVHVVMYLYYGLSALGPVAQPYLWWKKHMTAIQLIQFVLVSLHITQYYFMPSCNYQYPVIIHLIWMYGTIFFVLFSNFWYQSYTKGKRLPRVLQQNGTPGITKVKAN +>XP_012926876.1_PREDICTED:_keratin-associated_protein_26-1_isoform_X2 +MSCRNSCSGNCSSESPRNSCHVPLNPAVALCSTSPAGCVSSGSVSSGYRPILCFSSPGRPLSVLPYGCQPSGSVVYRPQTVHVVSSGLRPVQPLSSGCQPLTSVVSPCHASCSAQGAQ +>XP_004863648.1_PREDICTED:_TAR_DNA-binding_protein_43_isoform_X1 +MSEYIRVTEDENDEPIEIPAEDDGTVLLSTVTAQFPGACGLRYRNPVSQCMRGVRLVEGILHAPDAGWGNLVYVVNYPKDNKRKMDETDASSAVKVKRAVQKTSDLIVLGLPWKTTEQDLKEYFSTFGEVLMVQVKKDIKTGHSKGFGFVRFTEYETQVKVMSQRHMIDGRWCDCKLPNSKQSPDEPLRSRKVFVGRCTEDMTADELRQFFSQYGEVEDVFIPIPFRAFAFVTFADDQVAQSLCGEDLIIKGISVHISNAEPKHNSNRQLERSGRFGGNPGGFGNQGGFGNSRGGGAGLGNNQGSNMGGGMNFGAFSINPAMMAAAQAALQSSWGMMGMLASQQNQSGPSGNNQSQGNMQREPNQAFGSGNNSYSGSNSGAAIGWGSASNAGSGSGFNGGFGSSMDSKSSGWGM +>XP_012928539.1_PREDICTED:_macrophage_erythroblast_attacher_isoform_X2 +MVVAELEKTLSGCPAVDSVVSLLDGVVEKLSVLKRKAVESIQAEDESAKLCKRRIEHLKEHSSDQPAAASLWKRKRMDRMMVEHLLRCGYYNTAVKLARQSGIEDLVNIEMFLTAKEVEESLERRETATCLAWCHDNKSRLRKMKSCLEFSLRIQEFIELVRQNKRLDAVRHARKHFSQAEGSQLDEVRQVMGMLAFPPDTHISPYKDLLDPARWRMLIQQFRYDNYRLHQLGNSSVFTLTLQAGLSAIKTPQCYKEDGSSKSPDCPVCSRSLNKLAQPLPMAHCANSRLVCKISGDVMNENNPPMMLPNGYVYGYNSLLSIRQDDKVVCPRTKEVFHFSQAEKVYIM +>XP_004855850.1_PREDICTED:_nodal_modulator_3_isoform_X2 +MRAGRGAGPVGVAAAVLLLLSGVGPARGSEDIVVGCGGFVKSDVEINYSLIEIKLYTKHGTLKYQTDCAPNNGYFMIPLYDKGDFILKIEPPLGWSFEPTNVELYVDGVNDICTKGGDINFVFTGFSVNGKVLSKGQPLGPSGVQVSLRNTGTEAKIQSTVTQPGGKFAFFKVLPGDYEILATHPTWALKEASTTVRVTNSNANAAGPLIVAGYNVSGSVRSDGEPMKGVKFLLFSSLVTKEDVLGCNVSPVPGFQAQDESLVYLCYAISKEDGSFSFHSLPSGGYTVIPFYRGERITFDVAPSRLDFTVEHDSLRIEPVFHVMGFSVTGRVLNGPEGEGVPEAVVTLNNQIKVRTKADGSFRLENITTGTYTIHAQKEHLYFETVTIKIAPNTPQLADIIATGFSVCGEVSITRLPDTAKQMSKYKVVLSSQDKGKSLVTVETDAHGSFCFKAKPGTYKVQVVIPEAETRAGLLLKPQTFPLTVTDRPVMDVAFVQFLASVSGKVSCLDTCGDLLVTLQSVSRQGEKRSLQLSGKVNSMTFTFDSVLPGKYKISIMHEDWCWKNKSLEVEVLDDDVSAVDFRQTGYMLRCSLSHAITLEFYQDGNGAENVGIYNLSKGVNRFCLSKPGVYKVTPRSCHRFEQAFYTYDTSSPSILTLTAIRHHVLGTLTTDKMMDVTVTIKSSIDSEPALVLGPLKSAQELRREQQLVEIETRRQEREKNGKEEGGEGRTKPPGQEMVDELQGPFSYDFSYWARSGEKITVTPSSKELLFYPPSVEAVVSGESCPGRLIEIHGKAGLFLEGQIHPELEGVEIVISEKGASSPLITVFTDDKGAYSVGPLHSDLEYTVTSQKEGYVLTAVEGTIGDFKAYALAGVSFEIKAEDDQPLPGVLLSLSGGVFRSNLLTQDNGILMFSNLSPGQYYFKPMMKEFRFEPSSQMIEVQEGQNLRITITGYRTAYSCYGTVSSLNGEPEQGVAVEAVGQKDCSIYGEDTVTDEEGRFRLRGLLPGCVYHVQLKAEGNDHIERALPHHRVIEVGNNDIDDINIIVFRQINQFDLSGNVITSSEYLPTLWVKLYKSENLDNPIQTVSLGQSLFFHFPPLLRDSELIPLLWQLSSRLQGVRALGQAAPDSSGPEDAKRQAKKQKTRRT +>XP_004848491.1_PREDICTED:_homeobox-containing_protein_1_isoform_X3 +MLSSFPVVLLETMSHYTDEPRFTIEQIDLLQRLRRTGMTKHEILHALETLDRLDQEHSDKFGRRSSYGGSSYGNSTHNVPASSSTATASTQTQHSGMSPSPSNSYDTSPQPCTTNQNGRENNERLSTSNGKMSPTRYHANSMGQRSYSFEASEEDLDVDDKVEELMRRDSSVIKEEIKAFLANRRISQAVVAQVTGISQSRISHWLLQQGSDLSEQKKRAFYRWYQLEKTNPGATLSMRPAPIPIEDPEWRQTPPPVSATPGTFRLRRGSRFTWRKECLAVMESYFNENQYPDEAKREEIANACNAVIQKPGKKLSDLERVTSLKVYNWFANRRKEIKRRANIAILESHGIDVQSPGGHSNSDDVDGNDYSEQDTWQVRNGEEEEGRSSEGGREAEKDDSMSHSDHQDPISLAVEMAAVNHTILALARQGTNEIKTEALDDD +>XP_004846770.1_PREDICTED:_Fanconi_anemia_group_E_protein_isoform_X1 +MATPEGAPPGAEGAGPEPWAPLEAPARLLLQALQAGSDGARRGLGVLRALGRRDGDPFSWGDLLGALCREEPALRGPGGPLELRPLLLRLPQFCQRNLLSLLMAVRPSMPESQLLPVLRIARQDRVSAPDAWLQALGRLLQRDLGPGVSLEGASVLSEGCRAQLRSLCRRLGQGGRRLKLPRAPDLEEEEDRESQQCGKRRQRPGEETGNPEGEKAPKRFRSGEREEEEDDHKERPGALSLESLVAGGAASPLRKEPLVMGAGPCGACQSPGEAEGRWASVELPGALQAQVPRLQQLLRTFGEGLGGLGDTPPKELQLLHECSPGQVEQLCAQLQLPQLSDASLLQLCTWLLALSPGLSISNATVLARSLFLGRVLSLTSSASRLLRTALTSFCASYPYPVCSALLGTVLQAPGTGPAQTELLCHLMKDESLEPDAQALMLGLHLSGPGLPSSPVPPQASGLAPCEALQNGDLRLSPAPGLCGVGAGCPGLVRGQAVLTRPLLCRQILELSWKEETFLVLQALLERQVEMTPEKLSVLMEKLCKEGLAATASVAYAKLMLTVMTKYQASITETQRLGLAGALETHTTFLRKSLQAALRRLAR +>XP_004846526.1_PREDICTED:_39S_ribosomal_protein_L14,_mitochondrial_isoform_X1 +MTFHSGQHPETLTYEEDLPLWDPMAASPALCGPLACVIRALGWHAFSTTGSIDAIQKLTRVRVVDNSALGNTPYHRPPRCIHVYNKSGVGKVGDRILLAIRGQKKKALIVGHRMPGPRMTPRFDSNNVVLIEDNGNPVGTRIKVPVPTSLRRKEGEYSKVLAIAQNFV +>XP_004866898.1_PREDICTED:_zinc_finger_protein_473 +MEEKEEELKKSHWAQATMMEEFATHDMGMDFTLEDWEQPGLDQGDLFWDTALDNYQNLPMLNPPRPSPTSHPDGEEELVALMRGSPEGMGPGMSETKNSPLKQNFLEEGLSQGIMEVFYKDDPWNSRLEVCLDESWLDNLQRDPESLQKSDDVTNNESTTESSSHELSHLSPCLLSIGEDSVTGVTEKSLTLAESKEYRSDFAYSPDQRQQDVVLGEEKPYKCSECEESFSHGNDLIQHWVTHIREEPSEHQEDQRDFSLTSYLSVCPVTHRGYRSYICKECGKTFSQNMQLQRHQKIHSREKPCKSQGGNCPSSYHGEPIKHQKTPRSPKSYKCNKCDMTFTQALHLIGHRKTHTRKHYECVTCQAVFTLRKHFIQHQKTHAVKTTSECQECGKTFKRRLSLIKHQAIHTGEKPYKCDECGKGFSHTSTLKIHQKVHSRERPYKCSDCSKAFSWKTHLHEHQQVHTGSRPHKCQECVRSFSRPSHLIRHQATHAMERLFGCAECSQTFSNKEYLVRHQKIHTIEAPYECLECGECFVCNSTLNCHLSVHAREKQRFDGTRKVLDQNLGQREHPRPDEKHFKCDKCGKAFNRNRYLTQHKKIHTRVQVFECNQCGKAFSQRTQLLCHQTVHSGKRPHECGEDEEVVLRTSLTRHQPSQSEHPFKCNECGNTFSQSTHLSEHQLIHTTKKPFKCNECERVFTQSNYLVQHQKAHVTKKHFLCSECGKMFHQSSCFSKHLRTHTGEKPFECGECGKAFGMNAELIRHRRVHTGEKPYLCQDCGKAFSQSSCLSIHRRVHTGEKPYLCSECGKAFTQRANLTQHERIHTGEKPYACGVCGKAFGFSAHLTQHQRSHTQEKPYQCQHCQKAFKCFFTLIRHQRVHARK +>XP_012926773.1_PREDICTED:_protein_C-ets-2_isoform_X2 +MNDFGIKNMDQVAPVANSFRGTLKRQPAFDTFDGSLFAVFPSLNEEQTLQEVPTGLDSISHDSASCELPLLTPCSKAVMSQALKATFSGFQKERRRLGIPKNPWLWSEQQVCQWLLWATNEFSLVNVNLQRFGMNGQVLCDLGKERFLELAPDFVGDILWEHLEQMIKENQEKAEDQYEENSHLNSVPQWVNNNTLGFGVEQSPYGMQTPSYPKGGLLDALCPSSTAPGVLSSEQDFQMFSKSRLSTVSGNYCSVGQDFPGGNLNLLASSTGKPKDHNSPKNGGDSFESSDSLLRSWNSQSSLLDVQRVPSFESFEDDCSQALCLGKPTISFKDYIQERSDPVEQGKPVIPAAVLAGFTGSGPIQLWQFLLELLSDKSCQSFISWTGDGWEFKLADPDEVARRWGKRKNKPKMNYEKLSRGLRYYYDKNIIHKTSGKRYVYRFVCDLQNLLGFTAEELHAILGVQPDTED +>XP_004867383.1_PREDICTED:_arylsulfatase_E +MPRPDRFGRCLPAVLTLFLAVKVSTCGEGPGSRPNILLLMADDLGLGDVGCYGNTSIRTPNIDQLAADGVKLTHHIAAASVCTPSRAAFLTGRYPIRSGMISYNGYRVLQWTGVAGGLPPSEITFAKILKEKGYTTGLIGKWHLGLNCKSPSDHCHHPLNHGFDHFYGMPFTMMGDCTGWELSERRVGLQRRLDFYFQVLAFAALTLAAGKLSHLLPVSWVPTLSITVLAATVFTTSYFLGDLLVHADCFLMRNHVITEQPMRFEKTTSLLLKEAESFLKRNKQGPFLLFVSFLHVHAPLITGKEFLGQSRHGLYGDNVEEMDWMVGRILGCLEEEGLSDSTLVYFTSDHGGSLESQLGSHQYGGWNGIYKGGKGMGGWEGGIRVPGLFRWPGVLPAGRVIREPTSLMDIFPTVVELAGGQVPRDRAIDGQDLWPLLLGSTPHKHLLPHHEVLFHYCEHLLHAARWHQRDRGRVWKVHYMTPIFQPEGAGACYGRQVCPCSGENVTTHDPPLLFDLTRDPGERQALTPDTEPEFHAVVSRVQREVDRHRQGLLRSVFQQLGTYLNTWRPWLQPCCGTFPLCWCCPEDEPREDPQ +>XP_004866767.1_PREDICTED:_lysophospholipid_acyltransferase_7 +MSPEEWTYLVVLLISIPIGFLFKKAGPGLKRWGAAAVGLGLTVFTCGPHTLHSLITMLGTWALIQAQPCSCHALALAWTFSYLLFFRALSLLGLPTPTPFTNAVQLLLTLKLVSLASDVQDLHLAQRKEMASGFSKAPTLGLLPHVPSLMETLSYSYCYVGIMTGPFFRYRTYLDWLEQPFPEALPSLRPLLCRAWPAPLFGLLFLLSSHLFPLEAVREDAFYARPLPTRLFYMIPVFFAFRMRFYVAWIAAECGCIAAGFGAYPVAAKARAGGGPTLQCPPPSSLEKAAALEYDYETIRNIDCYNTDFCMRVREGMRYWNMTVQWWLAQYIYKSAPASSYVLRSAWTMLLSAYWHGLHPGYYLSFLTVPLCLAAEGCLESALWGRLSPRGQKVWYWVHWFLKMRAYDYMCMGFVLLSMGSTLRYWASVYFCVHILAGACLGLGLALGGGRRSLRKTASESQAASTAPEKLREE +>XP_012930806.1_PREDICTED:_uncharacterized_protein_KIAA1614_homolog_isoform_X6 +MEGTEAAAEPAGGSPQKPKTGSRITSPVQVTSVVEGNDPEPQLDNGPLSRPWPFPPPKPPRLYRMQLHGSSVLESKVRALKEKMTASKQGVSPTTHEQSSTKKSKCRQVKPGRVQISEDSSLPDAVEVPYAQKLTGGQLDSSVNKEEPRSNGGSRPLPSAPELECWNGQNPLSPEVVWILSDRERGLAPGPDSLPESPSQGITPGWPVGPGPCKITCIPNLRKGRSDPLQDALVTVGDLDSTSLIPEEAFVPRTALLGTLWKARDLGTLGTGGNPLSLSDQVERNRLLLQEMLKVAEQSPPKTAPPAWTPSWNRTAPERSAGDVGWESGIFLQDSEQNRTFGPKPEAVLSTRHEEAKHLLQHPRMKARTRPLRASHDIVPAIAQGSRDGRRSPALGPRMTLACRDSPQSGSLSDSSSGESGSGQWPKQGMSTSHVRFEDEPAFEAEFRHLKRLQQRQRQVLSTELQAVGQGPLRSKPDLADYINQKVGMGAFHRLGDSRDCRGLPLPPPSWASERKYQECGLCPDSQCPDPRVPQELQAARGVEGVLHVSHSSSILSSPFRLLLADPGLDTERLRGTHIGETTTCPEEGDSALNSADTSDGCQTGSEEARTSLPIKASRQTQGSSPRQWDSRPQGGLGQSRKVKTELHGGLPACHSLGVEDTEVGDEVKEITGYTPVGTQFLKEDAIPKPPALEPEMAALESQRQPGSGLGSHQAHPVDPWAPCKLPYATTSSLKLAPSEPGIADQVTESHEYLETIHTSSLQQNHAQPAAPNRTQHPATSPSPEAWVASRTTSPVPHRKAGLAGPCRPGEQEEPVGNPLPLPPPRTPLRTCGLSSPQTQPCIPQARHPLLGLSANCNSCIPLGQQEPWGTAVYRGREKRVPCSQKPDPPLESSRDGGCQCSLGLADVAVFNSVGITLSLTSEEPESCQEAEEGLQRMESSSGSHMLSGASPGASAGPRPPLAAPSDSNKKRSSSIASTLGLKKLFSALGQASRPKLGKSRSYSVEHLQPDAPGSASHTSTHKVKRAPSLQSFHLVSPSRQHRKAASFQNLHSLLSGRGDRSSLYLVEGPGYPSAPGRPAKAPPRRALSVEDVGVPSLARTVGRVVAVFPDGTSQLQLQRSPEGTFGFRVGSGNGRRDSGRVS +>XP_004860505.1_PREDICTED:_replication_initiator_1_isoform_X1 +MLERRCRGPMAMGPAPPRLLSGPSQESSQTLEKESSRLSHRGTPVAQPGGQAPSKAHRCAHCRRHFPSWVALWLHTRQCQARLPLPCSECGHRFRHAPFLALHRQVHAAATSDLGFTCHLCGQSFRGWVALVLHLRVHSVAKRPIACPECERRFWQQKQLRAHLRKRHPPAPEVRPFICGNCGRSFAQWDQLVAHKRVHVAEALEEAAAKALGPRPRGRPAVTAPHPGGDAVDRPFQCACCGKRFRHKPNLIAHRRVHTGERPHQCPECGKRFTNKPYLTSHRRIHTGEKPYPCSECGRRFRHKPNLLSHSKIHKRSEGCPQAASGTRSAQVPAAAAEPSTELHPEKPTPEAAEPTPEVPLEPPRDQAEAPQSLYSCDDCSRSFRLERFLRAHQRQHSGERPFACPECGKNFGKKTHLVAHSRVHSGERPFACEECGRRFSQGSHLAAHRRDHAPERPFVCPDCGKAFRHKPYLAAHRRIHTGEKPYVCPDCGKAFSQKSNLVSHRRIHTGERPYACPDCDRSFSQKSNLITHRKSHIRDGAFCCAICGQTFDEEERLLTHQKKHDV +>XP_004842604.1_PREDICTED:_putative_ribonuclease_isoform_X1 +MFHLNSFKGLDVLPEMSLVIRNLQRAIPIRRVPLRRNVEIVRNILGVEKFDLGIICLDNKNIQHINGIYRKKNVPTDVLSFPFHEDLKAGEIPQPGFPDDYNLGDIFLGVEYIFQQCKENEDYCDILTGFLVTWNRASQKTQCEGCDLSPECSFPGQGRAHCTDMEKEVADIVPERDRKYPSTRFRPGISLASSYVSPGKGWSWTSGSTAPAP +>XP_012923981.1_PREDICTED:_ERI1_exoribonuclease_3_isoform_X3 +MATASPAADGGRGRPWEGGLVSWPPAPPLTIPWTWLGPSWGQHPGHWGFPALTEPSPSPAASLGIFEVRRVLDASGCSMLAPLQTGAARFSSYLLSRARKVLGSHLFSPCGVPEFCSISTRKLAAHGFGASMAAMVSFPPQRYHYFLVLDFEATCDKPQIHPQEIIEFPILKLNGRTMEIESTFHMYVQPVVHPQLTPFCTELTGIIQAMVDGQPSLQQVLERVDEWMAKEGLLDPNVKSIFVTCGDWDLKVMLPGQCQYLGLPVADYFKQWINLKKSPEEGVTEFCWKSSDGIQKGPWTWVCAEHGEYTVETSVGLQLRHGLLAQERTSRHEQGPQPAAHRPAPQRHR +>XP_004868768.1_PREDICTED:_sterol_regulatory_element-binding_protein_1_isoform_X1 +MDEPTFNEAALEQALTEPCELDAALLTDIEDMLQLINNQNSDFPGLFDPPYAGAGAGDTDPASPGACSPSSLSPPLSLSSPLEALLGGSKATPPPSSPPQSVLTPLKMFSSVSPFSPGHGIKEELVPLTILQPPTLPSPARQPPIPQPLPPLLPQSFPAPAPPQFNSTPVLGYSSSPGGFVAETPSGSAQPPLLGLPLASPTGVIPTSFHAPVQSMAPQQLLTATAAPGTTTVTSQIQQVPVLLQPHFIKADSLLLTTMKTDVGATVKATGISSLAPGTAVQTGPLQTLVSGGTILATVPLVVDADKLPINRLAAGSKAPGSAQSRGEKRTAHNAIEKRYRSSINDKIVELKDLVVGTEAKLNKSAVLRKAIDYIRFLQHSNQKLKQENLSLRSAVHKSKSLKDLVSDCGSGENADVAMEGVKSEVVDTLTPPPSDAGSPSQSSPLSLSSRSSGSGGSGSDSEPDSPVIEDSQVKPEQLPSPHSRGMLDRSRLALCALVFLCVFYNPLASLLSGRGLPSPLDATSVHHSPGRAMLGAEGRDGPGWAQWLLPPLVWLGNGLLVLLSLAFLFVYGEPVTRPHSGPAVHFWRHRKQADLDLARGDFAQAAQQLWLALRALGRPLPTSHLDLACSLLWNLIRHLLQRFWVGRWLAGRAGGLQRDCALRADVRASARDAALVYHKLHQLHAMGKYTGGHLTAANLALSALNLAECAGDTVSMATMAEIYVAAALRVKTSLPRALHFLTRFFLSGARQACLAQSSSVPLTMQWLCHPVGHRFFVDGDWAVCSAPRESLYSLAGNPVDPLAQVTQLFREHLLERALNCVAQPSLSPSPGSADGDREFSDALSYLQLLNSCSDAAGTPACSFSISSSMAATTGTDPVAKWWASLTAVVIHWLRRDEEAAERLYPLVEQLPRALQETERPLPRAALHSFKAVRALLGCGKSESGLASLAICEKASGYLQDSLATTSTGSSIDKAVQLLLCDLLLVARTSLWQQQQPPTSAQVAQGASSGPQASALELRGFQRDLSGLRRLAQSFRPAMRRVFLHEATARLMAGASPTRTHQLLDRSLRRRAGPGSKGGAAELEPRPTRREHAEALLLASCYLPPGFLSAPGQRVGMLAEAARTLEKLGDRRLLHDCQQMLMRLGGGTTVTSS +>XP_004845523.1_PREDICTED:_NFAT_activation_molecule_1_isoform_X2 +MKSWFPRQQAPAGPLMALQLLGLLLVPWTLRLAGGQSVSHTGPAILVSLANMTVPFSCRITYPYTPEFKDFTVSYFHVDLQGQKSPEKQKACHPGQGTENKTYTLKCLINPRLPDASATGTYYCCVHWQSIIVKDGGTFILVRETKASSKEASHPVVPRPKMCQPTLAAHCRICLHGPAAPGDRSLRLHRERGRQPAPRPESSLPGEKAAV +>XP_012921725.1_PREDICTED:_zinc_finger_protein_543-like_isoform_X3 +MGETEAGNGSVHQNHPPRLGRRWRSPAPRSSASAMAAAQVAVTFEDVAVRFTQEEWEQLDLSKRTLYWEVMLETCGLLTAVGCPLSKSELIYQLEHSQDLWTATGVLFQSFYSGNSTKLNSMKPTLAYQSWPEGALVHDHQTEGASGDFLLGPHQGQDEPCEVQKRLRPGMEAPREKLPGNRSPGHDGMGSADSVCSRSVQEHISPDPATCICDSNMPAADPSIREGENSYKCKECGKVFKNERLLIQHKWIHTGVKRYECTECGKTFRKSTHLLQHHIVHTRERPYMCLECDKAFSRKSYLTQHQRTHSGEKPYKCSECGQAFAHRSTFVLHNRMHTGEKPFVCKECGKAFRDRRAFNRHNIFHTGEKPYQCSECGKAFNQRSYLTWHQQTHKGVKPFQCNECGRGFCEIAGLIHHYVIHTGEKPYKCVECGKAFLREPHLKQHQRIHTGEKPYVCSECGKAFAHYSTLTLHRRAHTGEKPFECKECGKAFTNRKDLIRHVSIHTGEKPYECMECGKAFNRRSHLIRHHRIHNEEKPYKCMECGKTFSRSTNLIQHSNIHTGDKPYKCNECGKAFSLSSSLRYHQRMHTGKIAASVRDEGKPFTSVQASVNIEGLILGKNFLHITTDEHQCSRESSNTDSGHSYHRETGLVASLLKKCK +>XP_004869294.1_PREDICTED:_cytochrome_c_oxidase_assembly_factor_7 +MAGLVDFQDEEQVKSFLKNMEVECNYQCYQEKDPEGCYRLVDYLEGIQKNFDEAAKVLKFNCEDNKHSDSCYKLGAYYITGKGGLTQDLKAAFSCFLMACEKPGKKSVEACHNVGLLTHSGKVNEDGQPDLGKARDYYAKACDGGFAPSCFNLSAMLLQGAPGFPKDMALACKYSMKACDLGHIWGCVNASRMYKLGDGVDKDEAKAEVLKDRARQLHKEQQKSVQPLTFG +>XP_012931504.1_PREDICTED:_ankyrin-1_isoform_X2 +MAQAAKQLKKIKDIEAQALQEQKEKEESNKKRRNRSRDRKKKADAATSFLRAARSGNLDKALDHLRNGVDINTCNQNGLNGLHLASKEGHVKMVVELLHKEIILETTTKKGNTALHIAALAGQNEVVRELVNYGANVNAQSQKGFTPLYMAAQENHLEVVKFLLENGANQNVATEDGFTPLAVALQQGHENVVAHLINYGTKGKVRLPALHIAARNDDTRTAAVLLQNDPNPDVLSKTGFTPLHIAAHYENLSVAQLLLNRGASVNFTPKNGITPLHIASRRGNVIMVRLLLDRGAQIETRTKDELTPLHCAARNGHVRISEILLDHGAPIQAKTKNGLSPIHMAAQGDHLDCVRLLLQYNAEIDDMTLDHLTPLHVAAHCGHHRVAKVLLDKGAKPNSRALNGFTPLHIACKKNHIRVMELLLKTGASIEAVTESGLTPLHVASFMGHLPIVKNLLQRGASPNASNVKVETPLHMAARAGHTEVAKYLLQNKAKVNAKAKDDQTPLHCAARVGHTNMAKLLLESNANPNLATTAGHTPLHIAAREGHVDTALALLEKEASQACMTKKGFTPLHVAAKYGKARVAELLLERDAHPNAAGKNGLTPLHVAVHHNNLDIVKLLLPRGGSPHSPAWNGYTPLHIAAKQNQMEVARSLLQYGGSANAESVQGVTPLHLASQEGHAEMVALLLSKQANGNLGNKSGLTPLHLVAQEGHVPVADVLIKHGVTVDSTTRMGYTPLHVASHYGNIKLVKFLLQHQADVNAKTKLGYSPLHQAAQQGHTDIVTLLLRSGASPNEVSSNGTTPLAIAKRLGYISVTDVLKVVTDETSVVLVSDKHRMSYPETVDEILDVSEDEGTAHITIMGEDLVGSKAERQDSRDMDEERELLDFVPKLDQVVESPAIPRIPCVTPETVLIRSEEPEQASKEYDEDSLIPSSPATETSDNISPVASPVHTGFLVSFMVDARGGSMRGSRHNGLRVVIPPRTCAAPTRITCRLVKPQKLSTPPPLAEEEGLASRIIALGPTGAQFLSPVIVEIPHFASHGRGDRELVVLRSENGSVWKEHKSRYGESSLDQILSGMDEELGSLEELEKKRVCRIITTDFPLYFVIMSRLCQDFDTIGPEGGSLKSKLVPLVQATFPENAVTKKVKLALQAQPVPDELVTKLLGNQATFSPIVTVEPRRRKFHRPIGLRIPLPPSWTDNPRDNGEGDTTSLRLLCSVIGGTDQAQWEDITGTTKLVYANECANFTTNVSARFWLSDCPRTAEAVNFATLLYKELTAVPYMAKFVIFAKMNDPREGRLRCYCMTDDKVDKTLEQHENFVEVARSRDIEVLEGMPLFAELSGNLVPVRKAAQQRSFQFQSFRENRLAIPVKVRDSSREPAGFLSFLRKAMKYEDTQHILCHLNVTMPACTKGTGAEDRRRTLTPLALRYSGLSFPSGTDRADLKVAVITEHLGLSWAELARELQFSVEEINRIRVENPNSLWEQSAALLNLWAAQEGENAKMENLYAALRNIDRSEIVNMLEGSGRQSRNLKPDRRQADQDYSLSPSQMNGYSSLQDELLSPASLHYTLPSPLHADQYWNEVAVIDAIPLAATEHDAMLEMSDMQVWSSGLTPSLVTAEDSSLECSKAEDSDATQEWKLEGALSEESRGPELGSLDLVEDDTVDSDATNGHADLLGQEEGQRSEEKRQEDSAGAGQDSENEVSLVAGQQRVQVRTTDSPSMSRVLERNQDRPQDWDFEGSIAFYLQDAARGSWPEEATQGPHSFQTTTSTIQGSEHDTVLVSVGEHMWTAQPETQSSQAGREGGIRAARSTFLQVEQGNELQNIPGEQVTEEQFTDEQGNFVTKKTIRKVVRQIDSSGADDTQEHEEVIVGGPLEKDTSVLETDPDFITKLDKVELRGSSLQPDLLEGRKGAQIVKRASLKRGKQ +>XP_004855359.1_PREDICTED:_DNA_replication_complex_GINS_protein_SLD5 +MTEELDLAGPDSDAGSEEVVLTPAELIERLEQAWMNEKFAPELLESKPEIVECVMEQLDHMEENLKRAKKEDLKVSIHRMEMERIRYVLSSYLRCRLMKIEKFFPHVLEKEKTRPEGEPSSLSSEEFAFAKEYMAHTETYLKNVALKHMPPNLQKVDLLRAVPKPDLDSYVFLRVKERQENILVEPEADEQKDYVIDLEEGSQHLIRYRTIAPLVASGAVQLI +>XP_012933799.1_PREDICTED:_putative_bifunctional_UDP-N-acetylglucosamine_transferase_and_deubiquitinase_ALG13_isoform_X2 +MNNHQLQLAKQLHKEGHFFCCTCRILTCLGQAPPLASPALGKCQDSAGLTPAAFCLNFELLSGDLQAQALLPAPHSSLHPAASSFPHFCSFSPPSIPCTMHKGWKKYGGQKSLNETSMDEYLGSLGLFRKLTAKDASCLFRAISEQLFCSQVHHLQVRKACVTYMKENQQTFESYVEGSFEKYLQRLGDPKESAGQLEIRALSQIYNRDFILYRHPGKPPIYVTDNGYKDKIVLCYSSNGHYDSVYSKQFQSSAAICQAVLYEILYKDVFVMDEEALKTAVQLFRSGSKKNRNNAVTGSEDAHIDYKSSTQDRNEEWGAGCSIQNIPEGYNQGMEELKSPENPSKMLFPYKVLKALDPEIYRNVEFDVWLDSRKELQKSDYMEYAGRQYYLGDKCQVRLESDGKYYNAHIQEVGNENHSVTVFIEELAEKHVVPLANLKAVTQVTPVPTWNAMPSRKGRGYQKMSTGYVPEMAMPEMDIKQRKKMFKKVRGKEVYMTVAYNRGDSLPPPRLQHSMHYEHDPPLHYSQTGANVMCNEQFHHQHSSHRQGRGYGIPRDSSRFINRHSMPSPKVGFYSEPGKRCCQSFDNFSYRSRSFRRSHRQMHCMNKECHFGFAPENGQVPSGLEETVTFYEVEEGDTTAYPTLPNHGNPSMMVPATSGYCVGRRGHSSGKQTSNSEEGNGQSDNGRYEEYLYPSEPDYETSGVYSTTASTANLSLQDRRPCSSMSPQDAVTSYNYHQKMMGNSAVIAVSCASTVPAPVLPNCVTANQTTSASSVSSQNAIQPLFVPPPAQGRPVIASPSYQYHSAAIPAAASFPPPPPPPPPPPPPPPPPFEVEEASNLASQLPPYSCDPNGSDLPQDTKVLQYYFNLGLQCCHHNYWHSMVYVPHMQQPHVENYPIYTEPPPLMDQTVPNLYSEVARADGAQTEASANGTFANADSASIPHGAVYYPVMSDPYAQPPLPGFDSCLPVVPDYSCVAPCHPVAAAYGGSSQIHGAVNPGAVGYIASPPSSSHYVPQNM +>XP_012927209.1_PREDICTED:_two_pore_calcium_channel_protein_1_isoform_X1 +MAVNLDDDVPLILTMDEGCSAPAASSNSLGPEQLPSRNGGSHTIPDSRAPSLVSGGENSPASPTPHDWEMNYQEAAIYLQEGENNDKFFTHPKDAKALAAYLFAHNHVFYLMELLTALLLLLLTLCEAPAVPALRLGIYVHATLELFALMVVVCELCMKLRWLGLHTFVRHKRTMVKTSVLVVQFVEAIVVLVRQTSHVRVTRALRCIFLVDCRYCGGVRRNLRQIFQSLPPFMDILLLLLFFMIIFAILGFYLFSPNPSDPYFSTLENSIVSLFVLLTTANFPDVMMPSYSRNPWSCVFFIVYLSIELYFIMNLLLAVVFDTFNDIEKRKFKSLLLHKRTAIQHAFRLLTSQRRPSGISYRQFEGLMRFYKPRMSARERFLTFKALNQSNKPLLSLEDFCDIYEIATLKWKAKRNREHWFDELPRTAFLIFKGINILVQSKAFQYFMYLVVAVNGMWILVETFMLKGGNFFPKHVPWSYLVFLTIYGVELFLKVAGFGPVEYLSSGWNLFDFSVTVFAFLGLLALALNMEPFYFIVVLRPLQLLRLFKLKKRYRNVLDTMFELLPRMASLGLTLLIFYYSFAIVGMEFFCGLLYPNCCNTSTVADAYRWLNHTVGDKTVVEEGYYYLNNFDNILNSFVTLFELTVVNNWYIIMEGVTSQTSHWSRLYFMTFYIVTMVVMTIIVAFILEAFVFRMNYSRKSQDSEVDGGITLEKEISKEELVAILELYRGARGASSSVTQLLETLSQMEKYQQNSLVFLGRRSRTKSDLSLKMYQEEIQEWYTEHAREQEAQRQQLSSSGTVPTTQQPPGSRQRSQTIT +>XP_012923705.1_PREDICTED:_S_phase_cyclin_A-associated_protein_in_the_endoplasmic_reticulum_isoform_X3 +MMMNTAVDCKITSVVGDKNFDKSPTKTRHPRKIDLRARYWAFLFDNLRRAVDEIYETCESDQSVVECKEVLMMLDNYVRDFKALIDWIQLQEKLEKTDAQSRPTSLAWEVKKMSPGRHVIPSPSTDRINAASNARRSLNFGGSPGTVVAPCLAPAGVSWADKVKAHHTGSASSDTAPAQLCPPMAVQKVSRRNERKDAEGWETVQRGRPVRSRSTGVVPKVSLVPEALKLKKDDTNKENLCRLPEESIQKDDFFRDRSSNIVEPRPRDSFHSSDHPLAERTQFTVNTLDDVKNSGSSQDCSVQTYEIPAVHNDEECVSVTQQADIPPLRTNEENLLAEKERIENEMDPSDISNVSAAHLSMAEVLAKKEELADRLEKANEEAIASAIAEEEQLTREIEAEENNDINIETDNDSDFSASMGSGSVSFCGMSMDWNDVLADYEARESWRQNTSWGDIVEEEPARPPGHAIHMHEKLSSPSRKRTIAESKKKHEEKQMKAQQLREKLREQKTLKLQKLLEREKDVRKWKEELLDQRRRMMEEKLLHAEFKREVQLQAIVKKAQEEEAKVNEIAFINTLEAQNKRHDVLSKLKEYEQRLNELQEERQRRQVEKQARDEAVQERKRALEAERQARVEELLMKRKEQEARIEQQRQEKEKAREDAARERARDREERLAALTAAQQEAMEELQKKIQLKHDESIRRHMEQIEQRKEKAAELSSGRHANTDYAPKLTPYERKKQCSLCSVLISSEVYLFSHIKGKKHQQSVRENSSIQGRELSDEEVEHLSLKKYIVDIVVESSAPSEPVKDGEERQKNKKKAKRIKARMNSRAKEYESLIETKNCGSDSPYKAKLQRLAKDLLKQLQVQDSGSWLNNKVSALDRTLGEIARILEKENVADQIAFQVAGGLTALEHILQVAVPATNVNTVSRIPPKSLCSAISVYYLTCNNCSENCTDVLFSNKITFLMDLLTYQLTVYVPDENNAILGRNTNKQVYEGLTTGLLKVIAAVFGCLIANRPDGNSRPATPKISTQEMKNKPSQGDAFNSRVQDLISYVVSMGLIDKLCGCFLSVQGPVDENPKMATFLQHAAELLHGMCTLCFAVTRRSYSIFDSNRQDPTGLTAALQTTDLAGVLHMLYCILFHGTISDPSSASPKESYAQNTVQVAIQSLRFFNSFAVLDLPAFQSIVGAEGLSLAFRHMASSLLGHCSHVSCESLLHEVIVCVGYFTVNHPDNQVIVQSGRHPTVLQKLCQLPFQYFSDPRLIKVLFPSLIAACYNNCQNKVILEQEMSCVLLASFIQDFTQTPNQAEPQPHQPRGRCLGPQDYLELANRFPQQAWEEARKFFLKKEKN +>XP_004836777.1_PREDICTED:_mastermind-like_protein_1_isoform_X1 +MVLPTCPMAEFALPRHSAVMERLRRRIELCRRHHSTCEARYEAVSPERLELERQHTFALHQRCIQAKAKRAGKHRQPPAAPAPRLDAADGPEHGRPATHLHDTVKRNLDSTASPQNGEQQNGYGDLFPGHKKTRREALLGVALSANGLPPSSPLGQPDKPSAGEALQSGGKHSLGLESINKKCLADPSLHLNGGSNTGESFPLSLSKELKQEPVDDLPCMITGAGGSISQSNLMPDLNLNEQEWKELIEELNRSVPDEDMKDLFTEDFEEKKDPEPSGSATQTPLSQDINIKTEFSPAAFEQEQLGSPQVGAGPAGQSFPGPSSAPVRTDNPSASLMPASAQAQSAQRALTGVVLPGQGPGGAPELSSAHQLQQIAAKQKREQMLQNPPQAVPAPAPGQMSSWQQTGPSHSPLDVPYPIEKPASPAGYKQDFPSSQLLMMPGVNKSSPRPGAPFLQPGHVSLLSHQPQGNLSQNSVNNQGSVLDYGNTKPLSHYKADCGQGGPGSGQSKPALMAYLPQQLPHLNNEQNPLFLMKPKPGNMPFRSLVPPGQEQSPSSVPVPAQATSVGTQSPAVSVATTHSSAPYLSSQQQAAVMKQHQLLLDQQKQREQQQKHLQQQQQQQQFLQRQQQHLLAEQEKQQYQRHLTRPPPQYQDPTQSTFPPQVGQFTGSVSAVSGMNNLGSSNSSCPRVFPQPGNLMPMGPGHTSVSSIPSNSGPQDRGVAQFPGSQSMPQSSLYGMASGMTQMVAQPPPQAANGHAHISRQTSAGQTAAVPAAYGQNSLGSAGLSQQHNKGTLTSGLTKPPIPRVSAAIGGQNASWQHQGMPNLSSQTPGSSSVSPFTAASTFHIQQAHLKMSSPPFSPAMPSRPLAPMSSAAAAGSMLPPVSTQQRTSAPAPAPPQTAPQPGLPGLSPAGPELGPFSQSPASQMGSRAGLHCTQAYPVRTVAQELPFYSGQPGSSGLSGVAGHTDLIDSLLKNRTSEEWINELDNFLGSQ +>XP_004834988.1_PREDICTED:_oxysterol-binding_protein-related_protein_11_isoform_X1 +MQSGEPVSTMRVSESEGRLEALATAVTPSGKNSGAGAISGGGGGSRGGSAKGWQYSDHMENVYGYLMKYTNLVTGWQYRFFVLNNEAGLLEYFVNEQSRSQKPRGTLQLAGAVISPSDEDSHTFTVNAASGEQYKLRATDAKERQHWVSRLQICTQHHTEAIGKNNPPLKSRSFSLTSSGNSPISQRRPSQNAVSFFGVGHSKLQPGGRKAHLPPDHLVEVREMMSHAEGQQRDLVRRIECLPTSGLPSSLDQDLLMLKATSMATMNCLNDCFHILQLQHASHQKGSLPPGTTIEWLEPKIPLSNHYKNGAEQPFTAEQDKAVPVPEEQSAAESGLIALIAREPEDINSDEEVEDTCDDKEDDLGAVEEQRSVILHLLSQLKLGMDLTRVVLPTFILEKRSLLEMYADFMSHPDLFIAITSGASAEDRMVRFVEYYLTSFHEGRKGATAKKPYNPILGETFHCSWWVPKSSPGAPTGNAPNPAPEESASPAADCYTVRFVAEQVSHHPPVSGFYAECAERRMCVSAHVWTKSKFLGMSIGVTMVGEGVLSLLEHGEEYTFSLPCAYARSILTVPWVELGGKVGVSCAKTGYSASITFHTKPFYGGKLHRVTAEVKHNLSNTVVCRVQGEWNGILEFTYSNGETKCVDLTRLAVTRKRVRPLEKQDPFESRRLWRNVTEALSHAEMDKATEHKRALEERQRAEERLRAEAGAAWRTRYFTKEGDSWVYHKPLWKVLAAAQPAE +>XP_004852811.1_PREDICTED:_abhydrolase_domain-containing_protein_2 +MNAMMDTPELPAVFDGVKLAAVAAVLYVIVRCLNLKSPTAPPDLYFQDSGLSRFLLKSCPLLTKEYIPPLIWGKSGHIQTALYGKMGRVSSPHPYGHRKFITMSDGATSTFDLFEPLAEHCVGDDVTMVICPGIANHSEKQYIRTFVDYAQKSGYRCAVLNHLGALPNIELTSPRMFTYGCTWEFGAMVNYIKKTYPLTQLVVVGFSLGGNIVCKYLGETQANQEKVLCCVSVCQGYSALRAQETFMQWDQCRRFYNFLMADNMKKIILSHRQALFGDHIKKPQSLEDTDLSRLYTATSLTQIDDNVMRKFHGYNSLQEYYEEESCMRYLHRIYVPLMLVNAADDPLVHESLLTIPKSLSEKRENVMFVLPLHGGHLGFFEGSVLFPEPLTWMDKLVVEYANAICQWERNKSQCSDTEQVEAELE +>XP_004872457.1_PREDICTED:_Krueppel-like_factor_1 +MARAETALPSISMLTTLGPCPDTQEDFLKWWRLDEAQDLGPGPPDPMGPPLHVSPESEDAPGEDEDGDRDADAAWDLDLFLSSFPPPEPGGAPRTCALNTGEAPGAQYVPPSETLGAYPGGPGLVSGPLGPEEPAGWARAPDPFTAPGPGPEPKALALQPLYPGPGAASSGGFFPPAGLAVPAAPGAPYGLLSGYAPLYPAPQYQGHFQLFRGLRAPSSSPAAPPSFLGCLAPGTAGAGLVGTSTDPGVIAEVVPQKRSRRSWARKRQAAHTCAYPGCGKSYTKSSHLKAHLRTHTGEKPYACSWDGCGWRFARSDELTRHYRKHTGQRPFRCKLCPRAFSRSDHLALHMKRHL +>XP_004845279.1_PREDICTED:_endothelin_B_receptor +MQPPPSLRGLALVALVLACRSGRVWGEERGLPPAWATPTLLGTGETITPPTKTSLPRSFNSSLPESPAPAQVPKGRNTPGGPPRPHSAPSCHRNIEIKETFKYINTVVSCLVFVLGIIGNSTLLRIIYKNKCMRNGPNILIASLALGDLLHIVIDIPINVYKLLAEDWPFGVEMCKLMPFIQKASVGITVLSLCALSIDRYRAVASWSRIKGIGVPKWTAVEIVLIWVISVVLAVPEAIGFDMITMNYKGSHLRICMLHPVQKTAFMQFYKTAKDWWLFSFYFCLPLAITAFFYTLMTCEMLRKKSGMQIALNDHLKQRREVAKTVFCLVLVFALCWLPLHLSRILKLTLYDQNDPNRCDLLSFLLVMDYIGINMASLNSCINPIALYLVSKRFKNCFKSCLCCWCQSFEEKQSLEEKQSCLKFKANDHGYDNFRSSNKYSSS +>XP_004863717.1_PREDICTED:_GDH/6PGL_endoplasmic_bifunctional_protein_isoform_X7 +MLNPYTEPLHPGLWKMLTVAMCVALVGCLQAQELRGHVSIVLLGATGDLAKKYLWQGLFQLYLDEVGKDHSFSFHGAALTAPEQGWKLMAKALESLSCPSDMAPSHCAELKDQFLRLSQYRQLKTAEDYRTLSKDIEAQVKQEDLREAGRIFYFSVPPFAYVDIARNINSSCRPGPGAWLRVVFEKPFGHDHLSAQQLATELGSFFQEEEMYRVDHYLGKQAVAQILPFRDQNRKALDGLWNRHHVERVEIIMKETVDAEGRISFYEEYGVIRDVLQNHLTEILMLVAMELPLNVSSSAAVLQHKLEAFRGLRGLNKGSAVVGQYQAYSAQARRELQKPEGFHSLTPTFAGVLVHVDSLRWEGVPFTLMSGKALDERVGYVRVLFKNQAFCIQHERHWAPEQSPCLPRQIIFHIGHGELSHPAILVSRNLFRPSLPAHSWAEVQERPGLRVLGRPLSDFYAYSPLRERDAYSILLSHIFHGRKESFITTENLLASWDFWTPLLDSLAHEVPRLYPGGADTGCLLDLELNGGHLSFSQQQPEQLVPGPGSAPKPSDFQVLRARYRESPLISAWPEELISRLASDIEASALQAVQHFGKFHLALSGGSSPIALFQQLAMGHYSFPWAHTHLWLVDERCVPLSDPDSNFQGLQAHLLQHIRLPYYNIHPMPVHLHQRLCAEEDQGAQTYAGEISALVANSSFDLVLLGMGTDGHTASLFPQSPTGLDGEQLVVLTQSPFRPHQRMSLSLPLINRAKKVAVLVMGRTKRDITMLVSRVGQEPRKWPISGVLPSSGQLVWYMDYEAFLG +>XP_004860462.1_PREDICTED:_transmembrane_protein_176B_isoform_X2 +MTQNMVTVNGVSVASLPPQPTHINIHIHRESALTQLLKAVGSLKQLLSHPRDSGPSKARTSNEQLALGVKQILLGVVSCALGVSLYFGPRTELRVLGCAFWAGSVAIAAGAGAIVHEKHRGKLSGCVSGLLTLAGIAATVAAIVFCVRTLIWQTDDLNYKKFNSVCDRLVPVTTTTNYRWRNNNSDWRTENCRTLMKMTLHLFLGFCILLTVVCILNVIVSLASLGLHLRSMRGRSSEFLDEKESNQKLLRVNPVTPSTSKEETLTVINL +>XP_004839279.1_PREDICTED:_kanadaptin_isoform_X2 +MAETPSQSEPPASVELSDDFKKPTLPGSSAVRGKASAVSPANPEELTKECPTALPDLDSGEPDVLPLGPDGGETSSLLEQQLRPPTAVSSPGGPARGPQYQEPPWGGPATAPYSLETLKGGTILGTRSLKGASCCLFGRLSSCDICLEHPSVSRYHAVLQHRAPDPDGECDGHGQGFYLYDLGSTHGTFLNKTRIPPRTYCRVHVGHVFRFGGSTRLFILQGPEEDRETESELTVTQLKELRKQQQILLEKKMLGEDSDEEDMDTTERKGSASGQDDDMGCTWGMGEDAVEDEAEENPIVLEFQQEREAFYIKDPKKALQGFFDREGEELEYEFDEQGHSTWLCRVRLPVDDSTGKQLVAEAIHSGKKKEAMIQCSLEACRLLDTLGLLRQEAVSRKRKAKNWEDEDFYDSDDDTFLDRTGLIEKKRLNRMKKAGKIDEKPETFESLVAKLNDAEKELSEISERLKASSKGLSESASQDSLDAFMSEIKSGNALDGVSRKKLHLRTFELRKEQQRLKGLIKIVKPAEIPELKKTASQTADSGNKAKKLTLPLFGAMKGGSKFKLKTGTVGKLPPKRPELPPALMRMKDGPEVEEEEEEEEDEEKEKEEHERRMEDGSSGRLPELETEAAGQEMSVPAALTGSKEAKGGASKNEYESSTEELKKKKAPGPGRFLPTLSSKYPEDDPDYCVWVPPEGQSGDGRTHLNDKYGY +>XP_012922417.1_PREDICTED:_integrin-linked_kinase-associated_serine/threonine_phosphatase_2C_isoform_X4 +MVKHEGKGAKRKASEEEKNGSEELVEKKVCKGSSMIFGLKGYVAERKGEREEMQDAHVILNDITEECKPPSSLITRVSYFAVFDGHGGIRASKFAAQNLHQNLIRKFPKGDVVSVEKTVKRCLLDTFKHTDEEFLKQASSQKPAWKDGSTATCVLAVDNTLYIANLGDSRAILCRYNEESQKHAALSLSKEHNPTQYEERMRIQKAGGNVRDGRVLGVLEVSRSIGDGQYKRCGVTSVPDIRRCQLTPNDRFILLACDGLFKVFTPEEAVNFILSCLEDEKIQTREGKPAVDARYEAACNRLANKAVQRGSADNVTVMVVRIGP +>XP_004856471.1_PREDICTED:_metabotropic_glutamate_receptor_8_isoform_X1 +MVYEGKRSTSCPCFFLLTAKFYWILTMMQRTHSQEYAHSIRVDGDIILGGLFPVHAKGERGVPCGELKKEKGIHRLEAMLYAIDQINKDPDLLSNITLGVRILDTCSRDTYALEQSLTFVQALIEKDASDVKCANGDPPIFTKPDKISGVIGAAASSVSIMVANILRLFKIPQISYASTAPELSDNTRYDFFSRVVPPDSYQAQAMVDIVTALGWNYVSTLASEGNYGESGVEAFTQISREIGGVCIAQSQKIPREPRPGEFEKIIKRLLETPNARAVIMFANEDDIRRILEAAKKLNQSGHFLWIGSDSWGSKIAPVYQQEEIAEGAVTILPKRASIDGFDRYFRSRTLANNRRNVWFAEFWEENFGCKLGSHGKRNSHIKKCTGLERIARDSSYEQEGKVQFVIDAVYSMAYALHNMHKDLCPGYTGLCPRMSTIDGKELLGYIRAVNFNGSAGTPVTFNENGDAPGRYDIFQYQITNKSTEYKVIGHWTNQLHLKVEDMQWANREHPHPSSICSLPCKPGERKKTVKGVPCCWHCERCEGYNYQVDELSCELCPLDQRPNANRTGCQRIPIIKLEWHSPWAMVPVFIAILGIIATTFVIVTFVRYNDTPIVRASGRELSYVLLTGIFLCYSITFLMIAAPDTVICSFRRIFLGLGMCFSYAALLTKTNRIHRIFEQGKKSVTAPKFISPASQLVITFSLISIQLLGVFVWFVVDPPHTIIDYGEQRTLDPENARGVLKCDISDLSLICSLGYSILLMVTCTVYAIKTRGVPETFNEAKPIGFTMYTTCIIWLAFIPIFFGTAQSAEKMYIQTTTLTVSMSLSASVSLGMLYMPKVYIIIFHPEQNVQKRKRSFKAVVTAATMQSKLIQKGNDRPNGEVKSEVCESLDTNTSSTKTTYISYSNHSI +>XP_004845721.1_PREDICTED:_cytohesin-4_isoform_X2 +MDLCHPESAELSSRETEELQRIKWHRKQLLEDIQKLKDEIAEVFAQIDCFERAEDSRMAQKEKELCIGRKKFNMDPVKGIQYLTEHKLLPPCAQDIAQFLYKGEGLNKTAIGTYLGERDPLNLQVLQAFVDCHEFTNLNLVQALRQFLWSFRLPGEAQKIDRMMEAFAARYSLCNPGVFQSTDTCYVLSFSIIMLNTSLHNPNVRDRPPFERFVSMNRGINDGGDLPQEQLRNLFDSIKSEPFSIPEDDGSDLTYTFFNPDREGWLLKLGGRVKTWKRRWFILTDNCLYYFEFTTDKEPRGIIPLENLSVQKVDDPKKPFCLELYNPRCRGQRIKACKTDGDGRVVEGKHGSYRISAASTEERDQWIEAIQASITRVPFYDLVSARKKKIASKQ +>XP_012929023.1_PREDICTED:_nuclear_apoptosis-inducing_factor_1 +MAVPAKKRKMNFSEREVEIIVEELELKKHLLVNHFNAGVPLAAKSAAWHGILRRVNAVATCRRELPEVKKKWSDLKTEVRRKVAQVRAAVEGGEAPGSTEEDGAAGPGTGGSSGAGGPAVAPVLLTPMQQRICNLLGEATIISLPSTTEIHPVALGPAATAAAATVTLTQIPAETTYHALEEGVVEYCTAEAPPPLPAEAPVEMMAQHGDTSVKPQALKSRIALNSAKLIQEQRVTNLHVKEIAQHLEQQNDLLQMIRRSQEVQACAQERQAQAMEGTQAALSVLIQVLRPMIKDFRRYLQSHTPTPTPASDPGQVAQNGQPDSIIQ diff --git a/files/final_project/example/Proteins_3.fasta b/files/final_project/example/Proteins_3.fasta new file mode 100644 index 00000000..9d08e1b0 --- /dev/null +++ b/files/final_project/example/Proteins_3.fasta @@ -0,0 +1,200 @@ +>XP_004921092.1_PREDICTED:_LOW_QUALITY_PROTEIN:_putative_uncharacterized_protein_PQLC2L +MNVELYFTPYTKINSKRITGPYVSAKAITLLEENTGVNLHNLGQLFVTYKSGKVDEAVPLGFLLCRIGEDLINFVGCYLINXLPFQILTTIFCVNMDIIIVSQFTYYKVKELEEKM +>XP_004867364.1_PREDICTED:_granulocyte-macrophage_colony-stimulating_factor_receptor_subunit_alpha-like_isoform_X1 +MPGTLEATQGAAGPMPRGPRPAGSPGRFLPAALVLLLTLCLDPAAALAPELAEVEPAPRLSVTFNPKSRRLTWDCRENATDARCFMLHKEKGPIEIKPWGKACACTFNYAPLHGGVTFEVHATVRGRPVREELLYPNPGHEGTAARNFSCFIYDAGSLNCTWARGPAAPGDVQYFLFIENTKTQTEQECPLYSPDSGTHTGCHLRDLSALGFRNYFLLNGTSLAAPIQYFDSIWTAKEIERLSPPDNVTVYCNTSHCRIRWRPPQTWIPLTYKDFTYQLDIQRRHAGLGSGTPPVQVAGEAENEYCFPSPEPRARQAVRVRVADVRGGPWSAWSRPAAFGSDTRAGPALRLYVPVVLGTLVCALVLGFLFRRFVGLRALCPRVPQVKDKVSSVDGVAHQVPWEDFAPGIRKGELEDVLTVEEVS +>XP_004857450.1_PREDICTED:_eukaryotic_translation_initiation_factor_5A-1 +MADDLDFETGDAGASATFPMQCSALRKNGFVVLKGRPCKIVEMSTSKTGKHGHAKVHLVGIDIFTGKKYEDICPSTHNMDVPNIKRNDFQLIGIQDGYLSLLQDSGEVREDLRLPEGDLGKEIEQKYDCGEEILITVLSAMTEEAAVAIKAMAK +>XP_004852124.1_PREDICTED:_uncharacterized_protein_C11orf91_homolog +MPKVRRGSRSPRMSQRPAPPRYFPSLYDGGISSSPFKEFNIWEKLFEPLKAGGAPAGEEAGDGPLPQVPFALEPRPPPGVGPPGECPWPSGLASIPYEPLCFYSPPPGPEVAPSPTAPSPAGSPLASALHPEELCELEIQIKELELLDIIGDGFDSQRYKLLKALKDEKLQGLKTRPLGKKLALLS +>XP_004867779.1_PREDICTED:_melanopsin +MDTPSGPRVSPDPAQEPSFLATLSAPGRGDGTPSSLSTPGQLPPGNPTAAGTQAAVRVPFSTADVPAHVHYTLGAVILLVGLTGMLGNLTVIYTFFRSRGLRTPANMFVINLAVSDFLMSFTQAPVFFTSSLYKRWLFGEAGCEFYAFCGALFGITSMITLTAITLDRYLVITRPLATIGLASKRQAALVLLGIWLYALAWSLPPFFGWSAYVPEGLLTSCSWDYMTFTPSVRSYTMLLFCFVFFLPLLIIIYCYVFIFRAIRETGRAFESCGESPSRRRQWQRLRSEWKMAKIALLVILLFVLSWAPYSTVALVAFAGHAHILTPSMSSVPAVIAKASAIHNPIIYAIAHPKYRMAIVQHLPCLGLLLGVSGQRSLPSLSYRSTHRSRLSSQASDLSWISGRRRQESLGSESEVGWTDTEAWGSAQQASGRPPCGMGLEGWEARAHPKAQEWEAETPGKTKGRLPSLDPQM +>XP_004834437.1_PREDICTED:_plastin-1_isoform_X1 +MENSTTTISREELEELQEAFNKIDIDNSGYVSDYELQDLFKEASLPLPGYKVREIVEKILVVADNNKDGKISFEEFVSLMQELKSKDISKTFRKIINKREGITAIGGTSSISSEGTQHSYSEEEKVAFVNWINKALESDPDCKHLIPMNPNDGSLFRSLADGILLCKMINLSEPDTIDERAINKKKLTPFTVSENLNLALNSASAIGCTVVNIGAQDLKEGKPHLVLGLLWQIIKVGLFADIEISRNEALIALLNEGEELEELMKLSPEELLLRWVNYHLTNAGWNTINNFSQDIKDSRAYFHLLNQIAPKSDREDGPAIAIDLSGFNEKNDLKRAGFMLQEADKLGCRQFVTPADVVSGNPKLNLAFVANLFNTYPCLHKPDNNEIDINLLEGESKEERTFRNWMNSLGVNPYINHLYGDLEDALVIFQLYEMIRVPVNWNQVNKPPYPALGGNMKKIENCNYAVELGKNKAKFSLVGIAGQDLNEGNSTLTLALVWQLMRRYTLNVLSDLGEGEKVNDEIIIKWVNQTLKNANKNTSISSFKDKSISTSLPVLDLIDAIAPNAVRQEMIKRENLSDEDKLNNAKYAISVARKIGARIYALPDDLVEVKPKMVMTVFACLMGKGLNRIK +>XP_012933697.1_PREDICTED:_pyrroline-5-carboxylate_reductase_1,_mitochondrial_isoform_X1 +MSVGFIGAGQLAYALAKGFTAAGVLAAHKVMASSPDMELATVSALRKIGVNLTPHNKETVRHSDVLFLAVKPHIIPFILDEVGADLEDRHLVVSCAAGVTINSIEKKLRTYRPGPKVIRCMTNTPVVVREGVTVYATGTHAQVEDGRLLEQLLGSVGFCTEVEEDLIDAVTGLSGSGPAYAFTALDALADGGVKMGLPRRLAVRLGAQALLGAAKMLLDSEQHPSQLKDNVCSPGGATIHALHVLESGGFRSLLINAVEASCTRTRELQTMADQETVSPAAIKKTVLDKVKLDSSARASLSSSDRAKPLAHSLAPAGQD +>XP_012923360.1_PREDICTED:_gamma-aminobutyric_acid_receptor_subunit_alpha-3 +MIITQMCHVYTTSLGLLFLLSILPATTGQGESRRQEPGDFVKQDIGGLSPKHPNIPEDSTDNITIFTRILDRLLDGYDNRLRPGLGDAVTEVKTDIYVTSFGPVSDTDMEYTIDVFFRQTWHDERLKFDGPMKILPLNNLLASKIWTPDTFFHNGKKSVAHNMTTPNKLLRLVDNGTLLYTMRLTIHAECPMHLEDFPMDVHACPLKFGSYAYTTAEVVYSWTLGKNRSVEVAQDGSRLNQYDLLGHVVGTEIIRSSTGEYVIMTTHFHLKRKIGYFVIQTYLPCIMTVILSQVSFWLNRESVPARTVFGVTTVLTMTTLSISARNSLPKVAYATAMDWFIAVCYAFVFSALIEFATVNYFTKRSWAWEGKKTPEVPETKEKTPATPTQKASTTFNIVGTTYPINLATKETEFSTISKGATSSASSTPTIIASPKATFVQDSPTEIKTYNSVSKVDKVSRIIFPVLFAIFNLVYWATYVNRESAIKGMIRKQ +>XP_012930246.1_PREDICTED:_leucine-rich_repeat_transmembrane_protein_FLRT1 +MVVAHPTAAATTTPTTTVTATVVMTTATMDLRDWLFLCYGLIAFLTEVIDSTTCPSVCRCDNGFIYCNDRGLTSIPTDIPDDATTLYLQNNQINNAGIPQDLKTKVNVQVIYLYENDLDEFPINLPRSLRELHLQDNNVRTIARDSLARIPLLEKLHLDDNSVSTVSIEEDAFADSKQLKLLFLSRNHLSSIPPGLPHTLEELRLDDNRISTIPLHAFKGLHSLRRLVLDGNLLANQRIADDTFSRLQNLTELSLVRNSLAAPPLNLPSAHLQKLYLQDNVISHIPYNTLAKMRELERLDLSNNNLTTLPRGLFDDLGNLAQLLLRNNPWFCGCNLMWLRDWVKARAAVVNVRGLMCQGPEKVRGMAIKDITSEMDECFETGSQGGAANAAAKTTASNHAAATTPQGSLFTLKAKRPGLRLPDSNIDYPMATGDGAKTLVIQVKPLTADSIRITWKATLPASSFRLSWLRLGHSPAVGSITETLVQGDKTEYLLTALEPKSTYIICMVTMETGNTYVADETPVCAKAETADSYGPTTTLNQEQNAGPMVGLPLAGIISGAVALVFLFLVLGAICWYVHRAGELLTQERAYNRGSRKKDDYMESGTKKDNSILEIHGPGLQMLPINPYHAKEEYVVHTIFPSNGSSLCKGTHTIGYGTTRGYRDGGIPDIDYSYT +>XP_012925936.1_PREDICTED:_general_transcription_factor_II-I_repeat_domain-containing_protein_1_isoform_X1 +MALLGKRCDLPANGCGPDRWNSAFTRKDEIITSLLSALDSMCSALSKLNAEVACIAVHDDSAFVVGTAKGRMFLSARKELQSDFLRFCRGPLWKDSEAEHPKKVLRGEGGSRSAPRSSLERGSDVYLLRKMVEEVFDVLYSEALGTASVVPLPYERLQREPGLLAVQGLPEGLAFRRPAEYDPKALMAILEHSHRIRFKLKRPLDDGGRDSKALVELNGVSLLPKASRDCGLHGQAPKVPPQDLPPTAASSSMASFLYSPGLAGHAVIRELKQEAPACPLAPSDLGLGLPLPEPKVPGAQDLSDCCGQKPTGPTGPLIQNVHASKRILFSIVHDKSEKWDAFIKDTEDINTLRECVQILFNSRYAEALGLDHMVPVPYRKIACDPEAVQIVGIPDKIPFKRPCTYGVPKLKRILEERHSIHFVIKRMFDERIFTGNKFTKDSTKLEPASPPEDPSAEASRAGLLDLAATAWSDKGSVSEDCGAGTSGELGMLRPIKIEPEDLDIIQVTVPDPSPASEDMTDSLPDPLPSEDSGYGMEVAADKGPSEDPRPEERPVEDSHGDVIRPLRKQVELLFNTRYAAVHSPSPAEAIGISEPVKVPYSKFLMHPEELFVVGLPEGISLRRPNCFGIAKLRKILEASDSIQFVIKRPELLTEGVKEPVADSQERDSGDPLVDESLRRQGFPENYDARLSRIDIANTLREQVQDLFNKKYGEALGIKYPVQVPYKRIKSNPGSVIIEGLPPGIPFRKPCTFGSQNLERILAVADKIKFTVTRPFQGLIPKPDEDDANRLGEKVILREQVKELFNEKYGEALGLNRPVLVPYKLIRDSPDAVEVTGLPDDIPFRNPNTYDIHRLEKILKAREHMRIVIINQLQPCTEISTDAKVPARDSVPKRKRKRASEGNSVSSSSSSSSSSSSNPESVASTNQISLVQWPMYMVDYTGLNVQLPGALNYWTSAPNQDLTERLKEV +>XP_004846237.1_PREDICTED:_ATP-dependent_RNA_helicase_SUPV3L1,_mitochondrial +MSFPRCALLWAWLPAGRQAGHRRVVCSHALRAHCGPFPGALGRVSALAAFSSSESGGSKAPNTSLFVPLTVKPQGPRTDGDVGAELTRPLDKNEVKKILDKFYKRNEIQKLGADYGLDARLFHQAFISFRNYIMQSHSLDVDIHIILNDICFHAAHVDDLFPFFLRHAKQIFPVLECKDDLRKISDLRIPPNWYPEARAIQRKIIFHSGPTNSGKTYHAIQKYFSAKSGVYCGPLKLLAHEIFEKSNAAGVPCDLVTGEERVTVVPDGKQTAHVSCTVEMCSVTTPYEVAVIDEIQMIRDPSRGWAWTRALLGLCAEEIHLCGESAAIDMVTELMYTTGEEVEVRNYKRLTPISVLDHALESLDNLRPGDCIVCFSKNDIYSVSRQIEIRGLESAVIYGSLPPGTKLAQAKKFNDPSDPCKILLATDAIGMGLNLSIKRIIFYSLLKPTINEKGEKEIEPITTSQALQIAGRAGRFSSQFKEGEVTTMNHKDLGLLKDILSRPVDPVKAAGLHPTAEQIEMFAYHLPDTTLSNLIDIFVDFSQVDGHYFVCNMDDFKFSAELIQHIPLSLRVRYVFCTAPINKKQPFVCSSLLQFARQYSRNEPLTFAWLRRYIKWPLSPPKNIKDLVDLEAVHDVLDLYLWLSYRFMDMFPDAILIRDLQKELDGIIQDGVRNINRLIRISESQKLLNLEGLSAGSQALLSRTLKGQTRRMNITKAAGRKTAEPASPGSEKITLASRLVQQGLLTPDLLRQLEKEWLTQQTQQGKERTESGTQLKGPRRKKKEPNSD +>XP_004863045.1_PREDICTED:_ceramide_synthase_5_isoform_X1 +MAAAAAGALGLLWGWLWSESFWLPQNVSWDDLEAPSDGHGYGYPRARHILSVFPLAAGIFSVRLLFERFIAKPCALHVGIEDSGPYLAQDNTILEKVFVSVTKYPDQKRLEGLSKQLDWDVRKIQCWFRHRRNQDKPPTLTKFCESMWRFTFYLCIFCYGIRFLWLSPWFWDTRQCWYNYPLQPLSKELYYYYIMELAFYWSLMFSQFTDIKRKDFLIMFVHHLATIGLITFSYINNMVRIGTLVLCLHDVSDFLLEAAKLANYAKYQRLCDSLFVIFGAVFMVTRLGIYPFWVLNSTLFESWEIIGPYPSWWFFNGLLLILQLLHIIWSYLIARIAFKALLRGKVSKDDRSDVESSSEEEDETINTKNLSSNSSSNGASWVNGHMGGSCWAEK +>XP_004866915.1_PREDICTED:_L-amino-acid_oxidase_isoform_X2 +MARLALHLLALAPILFSLAPSLAWKEASSQDPFEKCMHDPDYELLLKVVTQGLNRTLQPQKVIVVGAGVAGLVAAKVLSDGGHKVTVLEADNRIGGRILTFRDPKTSWSGELGAMRMPSSHRILHMLCKSLGLNLTKFTQYDENTWTEVNGVKLRNYVVEKMPEKLGYKLRPKERGRSPEDIYQMALNKAQKDVKALGCRKALRKFERHTLLEFLRGEGNLSRPAVQLLGDVMSKDGFFYLSFEEALRAHSCLSDQLRYSRIVGGWDLLPRALLSSLSGPVLLNAPVVAVTQGTRDVRVHIATSSQSRSLKALTADVVLLTASGPALQRMTFSPPLSRERQEALRRLHYVPATKVFLSFRRPFWQDEGIEGGHSNTDRPSRAVFYPPPGEGALLLASYTWSDATNAFAGLGTEEVLRLALTDVAALHGPHVYRLWDGTGIVKRWAEDPHSQGGFVVQPPVLWQTDGDEDSEAFAQPYDWTTPHGRIYFAGEHTAYPHGWVETAVKSALRAALRINSPEGQACTEAPQQLGAEHQATYRVPGHPLLRLPHSTHRKTSH +>XP_004840362.1_PREDICTED:_T-box_transcription_factor_TBX20_isoform_X1 +MEFAASPKPQLSSRANAFSIAALMSSGGSKEKEAESTIKPLEQFVEKSSCAQPLAELTSLDAQGEFGGAGGSSPSSTSLCTEPLIPTAPIIPSEEMAKITCNLETKELWDKFHELGTEMIITKSGRRMFPTIRVSFSGVDPEAKYIVLMDIVPVDNKRYRYAYHRSSWLVAGKADPPLPARLYVHPDSPFTGEQLLKQMVSFEKVKLTNNELDQHGHIILNSMHKYQPRVHIIKKKDHTASLLNLKSEEFRTFIFPETVFTAVTAYQNQLITKLKIDSNPFAKGFRDSSRLTDIERESVESLIQKHSYARSPIRTYGGEEDVLGEESQTTSNRGSAFTTSDNLSLSSWVSSSSSFPGFQHPQPLTALGSSTASIATPIPHPIQGSLPPYSRLGMPLTPSAIATSMQGSGPTFPSFHMPRYHHYFQQGPYAAIQGLRHSSAVMTPFV +>XP_004859031.1_PREDICTED:_tubulin-folding_cofactor_B +MEVTGMKAPTVTVFISSSLNSFRSEKRYSRSLTIAEFKCKLELVVGSPASCMELELYGADDKFYGKLDQEDALLGSYPVDDGCRIHVIDHSGARLGEYEDVSKVERYQISQEAYDQRQDTVRSFMKRSKLGRYNEEERAQQEAEAAQRLMEEKALASSISVGSRCEVRAPGQSPRRGTVMYVGLTDFKPGYWIGVRYDEPLGKNDGSVNGKRYFECQAKYGAFVKPSLVTVGDFPEEDYGLDEM +>XP_004867171.1_PREDICTED:_hypoxia-inducible_factor_3-alpha_isoform_X3 +MALGLQRARSSTELRKEKSRDAARSRRSQETEVLYQLAHTLPFARGVSAHLDKASIMRLTISYLRMHRLCAAGEWNQVGAKGEPLDACYLKALEGFVMVLTTEGDMAYLSENVSKHLGLSQLELIGHSIFDFVHPCDQEELQDALTPRPSLSKKKPEAPTQRCFSLRMKSTLTSRGRTLNLKAATWKVLHCSGHMRAYKSSGQPALAGNPSSEPPLQCLVLICEAIPHPGNLEPPLGRGAFLTRHSLDMKFTYCDERIAEVAGYSPDDLIGCSAYEYIHALDSDAVSRSIHTLLSKGQAVTGQYRFLARSGGYLWTQTQATVVSGGRGPQSESIICVHFLISRVEETGVVLSLEQTERHSRRPLQRGTSSQKDGPNPGDRLDTPGPWILAFLHPPALSEATLAADPRRFCSPDLRRLLAPILDGAAVATTPSTPQAAWRPRSPLAADLPDELLVGMERIHRLGAAGKNPEAEDTDLNIASDADALDLEMLAPYISMDDDFQLSSSEQLPRAFHRPPGTVPRPRAQSFHGLSPPTPEPAPLPRWGSDPRLSCSSPPRGDPSASSYTVGARKRALAQSSEDEGVDLLGVRPPKRSPSLDPENFLLPPVSLMGKPERARGWLKVIRKINGPAEVRTLIF +>XP_004859425.1_PREDICTED:_NF-kappa-B_inhibitor-interacting_Ras-like_protein_2 +MGKSCKVVVCGQASVGKTSILEQLLYGNHVVGSEMIETQEDIYVGSIETDRGVREQVRFYDTRGLRDGTELPRHCFSCTDGYVLVYSTDSRESFQRVELLKKEIDKSKDKKEVTIVVLGNKCDLQEQRRVDPDVAQHWAKSEKVKLWEVSVADRRSLLEPFVYLASKMTQPQSKSAFPLSRKNKASGSLDG +>XP_004851401.1_PREDICTED:_NADH-ubiquinone_oxidoreductase_75_kDa_subunit,_mitochondrial +MLRIPVRRALAGLSKSSTGYVRTTATVASNLIEVFVDGQSVMVEPGTTVLQACEKVGMQIPRFCYHERLSVAGNCRMCLVEIEKAPKVVAACAMPVMKGWNILTNSEKSKKAREGVMEFLLANHPLDCPICDQGGECDLQDQSMMFGSDRSRFLEGKRAVEDKNIGPLVKTIMTRCIQCTRCIRFASEIAGVDDLGTTGRGNDMQVGTYIEKMFMSELSGNVIDICPVGALTSKPYAFTARPWETRKTESIDVMDAVGSNIVVSTRTGEVMRILPRMHEDINEEWISDKTRYVLFVFFIFFVGLRIEKAKAVLNLVGSKKCFYFSWLHNDLQVALIGSPVDLTYRYDHLGESPKVLQDIASGSHPFSQVLKAAKKPMVVLGSSALQRSDGAAILTAVSSIAQNIRVTSGVPSDWKVMNILHRVASQVAALDLGYKPGVEAVRKNPPRVLFLLGADGGCITRHDLPKDCFIIYQGHHGDVGALIADVILPGAAYTEKSGTYVNTEGRAQQTKVAVTPPGLAREDWKIIRALSEIAGITVPYDTLDQVRNRLEEVSPNLVRYDDVEGANYFQQASELSKLVNQQLLADPLVPPQLTIKDFYMTDSISRASQTMAKCVKAVTEGAQAVEEPSIC +>XP_012923055.1_PREDICTED:_arylsulfatase_B_isoform_X2 +MGLPRGARPLLPLLLPLLLAPRSSGAGPGRPPHLVFVLADDLGWNDVGFHGSRLRTPHLDALAAGGVQLDNYYTQPLCTPSRSQLLTGRYQIHTGLQHQIIWPCQPSCVPLDEKLLPQLLQEAGYATHMVGKWHLGMYQKECLPTRRGFDTYFGYLLGSEDYYTHEHCVFIKALNVTRCALDFRDGEEVATQYKNLYSTNIFTNRATSLIANHPPEKPLFLYLALQSVHEPLQVPEEYLKPYDFIQDKNRHLYAGMVSLMDEAVGNVTAALKSHGLWNNTVFIFSTDNGGQTLAGGNNWPLRGRKWTLWEGGVRGVGFVASPLLKQKGVKNRELIHISDWLPTLVKLAGGDTHGTKPLDGFDVWRTISEGSPSPRMELLHNIDPSFVDLSPCPGNSTTPAKDDSFPEYSTFNTSVHAAIRHGNWKLLTGFPVSPQSGRQKFLV +>XP_004870855.1_PREDICTED:_uncharacterized_protein_C11orf70_homolog_isoform_X1 +MAAGEPGVSGGYYFRFLPQKTFPSLSAPETTSRLRQWSMLGRIKAQAFGFDQTYRAYRKDDFVMAFFKDPNVIPNLHLLSDSSGQWMTLGTEVKKVEATNVPCTQLSMSFFNRLYDENIVRDTGHIIKCLDSFCDPFLISDELRKRKGERKLGNGDGQVLHVAHPENNKLWTTSPHLSLTVLLVEDSEKYEVFSKPDREEFLFCLFKHLCLGGSLCQYEDVLNPYLETAKLIYKDLVSVRKHPQTKKIQITSSVFKVAAYDSTGMCYPSTKNHEQTFSYFIVDPIRRHVNVLYHCFGVGEMS +>XP_004847639.1_PREDICTED:_histone_H2B_type_1-A +MPELTSKVATISKKGFKKAVIKTQKREGKKRKKCRKESYCIYIYKVLKQVHPDTGISSKAMSIMNSFVSDTFERISSEASRLVHYNKRSTISSREIQTAVRLLLPGELAKHAVSEGTKAVTKYNSSK +>XP_004863992.1_PREDICTED:_matrix_metalloproteinase-23 +MRHGLCVPPGPSQAVAVRSRPLRAVLGALCLLPALAVLSWQGAPGGHAAQSDIQGWDSVVSNGPVPSPLSPLAPRKRRYTLTPGRLRWDHFNLTYRILSFPRNLLSPRETRRGLAAAFRMWSDVSPFSFREVDPEQPSDLRIGFYPDNHTDCLVSALHHCFDGPTGELAHAFFPPHGGIHFDDSEYWVLGPTRYSWKKGVWLTDLVHVAAHEIGHALGLMHSQHGQALMHLNATLRGWKALSQDELWGLHRLYGCLDRLFVCASWARRGFCDTRRRLMKRLCPSSCDFCYEFPFPTVAATPSPPRTKTRLVSEGRNVTLRCGQKILHKKGKVYWYKDQEPLEFSYPGYLALGKARLSIIANAVNEGTYTCVVRRHQRVLTTYSWRVHVRS +>XP_004870648.2_PREDICTED:_arf-GAP_with_dual_PH_domain-containing_protein_2_isoform_X1 +MSDRERNKKRLLELLHAADTGNARCADCGAPDPDWASYKLGIFICLHCSGVHRNFPEISKVKSVRLDFWDDSIVEFMTHNGNLHVKAKFEASVPAFYYIPQASDCSVLKEQWIRAKYERQEFMADGKPLSSPGNREGILWKRGRDNGQYLRRRFVLLAREGLLKYYTKEQGKGPKAVISIKDLNATFQTEKIGHPHGLQITYGRESHTRNLFLYHESGKEIVDWFNALRAARLQYLKMAFPDLPEAELVPLITRNYLKQGFMEKTGPKQREPFKKRWFALDPQERRLLYYKNPLDAFEQGQVFLGSKEQGYEVLEELPKGVRGSRWKAGLTIVTPHRRFVLTCPSEKEQREWLESFRDVLSRPLTPLHLLGAPTESGCSNR +>XP_012930984.1_PREDICTED:_protein_FAM63A_isoform_X1 +MEHAGPEQPGPDQVGRAEAVTWENHEVPLGSQEQPQNGNARDADGEREPGDPTPLPARGGENLERPVPEAQACPPGPACGKPPEVEMIGACSGPQELPQSPRARKPEPDFYCVKWIPWKGARTPVITQSANGPCPLLAIMNILFLQWKVKLPPQKEVITAEELMAHLGDCLLSIKPQEKSEGLQLNFQQNVDDAMMVLPKLATGLDVNVRFTGVSDFEYTPECSIFDLLGIPLYHGWLVDPQSPEAVSAVGKLSYNQLVEKIITCKHASDPNLVTEGLIAEQFLENTAAQLTYHGLCELTAAAKEGELSVFFRNNHFSTMTKHKSHLYLLVTDQGFLQEEQVVWESLHNVDGDSCFCDSDFHLSHSLGKAPGGEVGKSSPEEQLQVDQDYLIALSLQQQQQPQGALGLTDLELAQQLQQEEYQQQQAEQEQPGQARAPLPQGRGTTSGRPAREWHQRPKHQSDCILL +>XP_004871241.1_PREDICTED:_semaphorin-4A_isoform_X1 +MALPALGLDPWSLLGLFFFQLLLLLLPPLTAGAGGQGPMPRVRYSAGDPRRALSLFHQKGLQDFDTLLLSGGGNTLYVGVREAVLALDVQHPGAPQLRSMIPWPASDRKKHECALKKKSSETQCFNFIRVLVSFNATHLYACGTFAFSPACTFIEFRDSQLSPISEKTVMEGKGQSPFDPAHKHTAILVDGMLYSGTMNNFLGSEPILMRTLGPRPVLKTDTFLRWLQSDASFVAAVPSTQVVYFFFEETASEFDFFEKLRTSRVAQVCKNDMGGEKLLQKKWTTFLKAQLLCTQPGQLPFNVIRHAVLLPAESAAEARVYAVFTSQWQVGGTRSSAVCSFSLSDIENVFKGQFKELNKETSRWMTYVNPETSPRPGSCAVGPSSDKALTFMKDHFLMDEQVVGTPLLVKSDVEYTRLTVETARGLDGHSYVVMYLGTSTGFLHKAVVSQASRAYLVEEIQLFPEPEPIRNLQLAPSQGAVFAGFSGGVWRVPRANCSVYESCVDCVLARDPHCAWDPESRVCSLLWTLDLMSWKQDMERGNPEWACAKGPLGRSHRPQSRPQIIKEVLVVPNSILELPCPHLSVLASYRWSRGTRTVPEASSAVYNGSLLLLPQDGVGGLYQCIATENGFSYPVVSYWVHSQDQPLALDPELAGIPRERVQVPLTRVGGGATAAAQRSYWLHFLVVTVLLALVLSGALIVLLASPLGALRARGKVQGCGTLPPGEKAPLSREPRVQPPKESRTSATDVDADNNCLGTEVA +>XP_004862136.1_PREDICTED:_solute_carrier_family_41_member_1_isoform_X2 +MSSKPEPKDAHQLNGTGPAPSPCASDGPGREPLAGTSEFLGPDGAGVEVVVIESRANAKGVREEDALLENGSQSNESDDVSTDRGPAPPSPLKETSFSIGLQVLFPFLLAGFGTVAAGMVLDIVQHWEVFQKVTEVFILVPALLGLKGNLEMTLASRLSTAANIGQMDTPKELWRMITGNMALIQVQATVVGFLASIAAVIFGWIPDGHFSIPHALLLCASSVATAFIASLVLGMIMIGVIIGSRKIGINPDNVATPIAASLGDLITLALLSGISWGLYLELNHWRYIYPLVCAIFLALLPVWVVLARRSPATREVLYSGWEPVIIAMAISSVGGLILDKTVSDPNFAGMAVFTPVINGVGGNLVAVQASRISTFLHMNGMPGENSEQAPRRCPSPCTTFFSPDVNSRSARVLFLLVVPGHLVFLYTISCMQGGHTTLTLIFIIFYMTAALLQQNGRVKRKPAHSDNCSTAASNSLLIPLFPANKAL +>XP_004859278.1_PREDICTED:_RUN_domain-containing_protein_3A_isoform_X5 +MEAGLVPATMALGLSSKKASSRNVAVERRNLITVCRFSVKTLLEKYTAEPIDDSSEEFVNFAAILEQILSHRFKGPASWFSSDGQRGFWDYIRLACSKVPNNCVSSIESMENISTARAKGRAWIRVALMEKRMSEYITTAVRDSRTTRRFYDSGAIMLREEATVLIGMLIGLSAIDFSFCLKGEVLDGKTPVVIDYTPYMKFTQSYDYLTDEEERHSAESSTSEDNSPEHPYLPLVTDEDSWYSKWHKMEQKFRIVYAQKGYLEELVRLRESQLKDLEAENRRLQQQLEEAAAQNQREKRELEGVILELQEQLTGLIPGDHGLLAQASRELTTPLVNQWSLLGTLSGTEGASNPKLYRRHSFLSTEPLSAEASLSSDSQRLEEGKRDDQPWGPIGKDPTPSMLGLCGSLASIPSCKSLASFKSNECLPSQGALGRPRRLSFLLQEEQWAGTTPGTQGAAPPPAGPKAWPDPSGCSPAAASRLTPHTPEPAFPSPTRALGSSK +>XP_004848635.1_PREDICTED:_LOW_QUALITY_PROTEIN:_maestro_heat-like_repeat-containing_protein_family_member_2B +MFGDINVTLGILNKEDVISKEDIYSHLTSVIQNTDILGDAIVQRLIHYTSKDMKDEKVSLVLRFLAGEVLVSLAAHDFNSVMSEVQSNFRILELPNEFIVLALAELASSYVSQSIPFMMMTLLTMQTMLRLAEDERMKQTFCLALEKFSKAIYKYVNHWRDFPYPRLNASRLSDKIFMLFQYIMEKWAPAASHINTLALVKAHGPTVSLLLHWEDFCEFALSQVPWLLNQYGNQEADFHITQSVKQILTAAVLYDIDLPRALKRSIFINLLHQISRVPGPPSENEIEVSSCFLILAHLNPAALVEFFDEQIRSNNEAIRMKILTLLRSAINAEEPKLKNHIISIERXKVIMNDLSPKVRTSTLLFIQTMCEKSYIEAREGWPLIDYIFSQFATSSRTLEKPVKTNSPEDETGEKSVQETSLQVLKTLDPLVIGMPQVLRPRILTFVVPKEXTGTLDYLFNIIRILIMAEERKKHSVTESTALVRSPGAVKLPSPQQLLARLLVISMLASLGKLCGAGATGLLKIVPEMIHPKLIDLWETHKPELLHSMEGKNGSMVLWETMLLQLLKESLWKIRDVAWTFQLSRDFNQQMNSYSNTSVEKKFLWKALGTTLASCHDKDFVSSQIKEFLIAPSQLGDQRQGVASILGCCVEDHFDTVLKVLKTFQDEEKIFMNRCKSLFSGKKNLTKTDVIVIYGAVALHAPKRELLTRLHQDIMAQVLYLYGQCSQVLGMSVMNKDMDLQMSFTRSITEIGIAVQDAEDQNFQFSYKQMLISQMLDFIREEPLDSLASPVRWKALIAIRYLSKLKPQLPLHDHLKILEENIRRLLPLPPLEKLASQGETDNDQEHINFLYERSMDALGKLLRTMMWDDVDAENCQEMFNLLRMWLVSPKEWERERAFQITAKILTNDTEAPENFKIGSLLGLLAPHSCDTLPTIHQAATSSTIGLFCMKGIHLEVERLQNLQEGLECDDVQVQIKISSKIAKIVCKFIPTDEIQMFLEETLDGVESLNPMHMKACDIWMITALKEHGAVLEHQLLEILSTIHYHMPVLRQKEESFQFMLEAVSQIASFHMNAVVVSLLQKPLPFDRDTKTLWKALAENPASSGELIRALIDKLEARLEDDIAGIDAISVGCAMYEVVSTGVPVTGLYAELFTLLLKLVSCTLGQKMPTSALSHRRRVMQQGERQQVPDPCRLSTATLKCLQAQPMREGLAKDSDEGENLWTLLSNPDTHHIGVCALSRSMAVWQHRVILNIMEHLLPSLTSSSENYRITGTAFFSELMKEPIHWKHGNLRDMLILMDQSAWDSNATFRQTAIRGLGNTASGAPYKVKKHKQIILEFVIRGLYHLARTEVVCESLKALRKILELLTDRDVSFYFKEIVLQTRTFFEDEQDNVRLTAIILFENLASLTGRQWKTFFAEEIKKSMISFLLHLWDPNPKIGAACRDVLIICFPFLGLQELYEILDHLLDQDLPRARDFYRQFCMKLVSKNQEILWILHTHSFTFFTSSWEMIRSAAVKLTDAIVLNLTSQYVELLDREQLTTRLQALCLDPCIGVQRAAKAALQTLLRRCKETSIPL +>XP_004864467.1_PREDICTED:_2-hydroxyacyl-CoA_lyase_1_isoform_X3 +MPESHFVAPSDRSAEQVSGAKVVAQALKAQDVRYVFGVVGIPVTEIALAAQELGIRYIGMRNEQAASYAASAVGYLTGRPGVCLVVSGPGLIHALAGMANANMNCWPLIVIGGSSERNQETMGAFQEFPQAVRISIYGRPGACYVDIPADFVTVQVNVNSIKYKECCMPPPVTMAEASAVCLAASVIRSAKQPLLVIGKGAAYAHAEENIRKLVEQCKLPFLPTPMGKGVVPDNHANCVSAARSRALQFADVIVLFGARLNWILHFGLPPRYQPDVKFIQIDICAEELGNNVKPAVTLLGDINAVAKQLLEQFDKIPWQYPPESKWWKRLREKMKSNEAASKELASKISLPMNYYTVFYHVQEQLPKDCFLVSEGANTMDIGRTMLQNYLPRHRLDAGTFGTMGVGLGFAIAAALVAKDRSPGQRVICVEGDSAFGFSGMEMETICRYNLPIIVLVVNNNGVYQGFDADTWKEIVKFQDPVTVAPPMCLLPNSHYEQVMTAFGGKGYFVQTPEELQKSLKQTLEDTTKPSLINIMIEPQSTRKAQDFHWLTRSNM +>XP_012923573.1_PREDICTED:_NIF3-like_protein_1 +MLASPGRLVPAAFQLACSRAWSSSSGMDLKAVLSSLNDLAPLSFAESWDNVGLLVEPSPPHTVHTLFLTNDLTEAVLEEALREKADLVLSYHPPIFRPLTRVTWGTWKERLVVRALEARVAVYSPHTALDAAPQGVNTWLARGLGICTSKPIHPSRAPSHPTEGTHRVEFSVRHSQDLDTVLSAMKGISHASVTCFSSRTDSGEEQTRLSVTCTQEALTRVGVWLSQNSQLHEKTEVLVLEKPLLLQTGMGRLCTLEESVSLVTVIERVKRHLRLSHVRLALGAGRSLDSQVQDVALCAGSGSSVLQGVRADLYLTGEMSHHDVLDATSQGISVILCEHSNTERGFLSDLRDLLAMHLDSRVRLVLSECDRDPLSMM +>XP_004875617.1_PREDICTED:_E3_ubiquitin-protein_ligase_UBR2-like +MLYLIIMLVGERFSPGVGQVNATDEIKLEIIHQLSIKPMARSELVKSLPEDENKETGMENVTETVAHFKKPGLTG +>XP_004858495.1_PREDICTED:_lisH_domain_and_HEAT_repeat-containing_protein_KIAA1468_homolog_isoform_X1 +MAAMAPGGGGSGSGGVNPFLSDSEEDDDEVAATEERRAGLRLGASSGLDPGSAGSLSPQDPVALGSCARPGLSGEASAAAMALGGTGETPARLSVDAIAAQLLRDQYLLTALELHTELLESGRELPRLRDYFSNPGNFERQSGTPPGMGAPGILGAAGFGGAGGREPSTTSGGGQLNRAGSISTLDSLDFARYSDDGNRETDEKVAVLEFELRKAKETIQALRANLTKAAEHEVPLQERKNYKSSPEIQEPIKPLEKRALNFLVNEFLLKNNYKLTSITFSDENDDQDFELWDDVGLNIPKPPDLLQLYRDFGNHQVTGKDLVDVASGVEEDELEALTPILGNLPPTLETPQPLENSLLVQKLEDKISLLNSEKWSLMEQIRGLESEMDFLKNEHFAIPAVCDSVQHSLDQSPHKDSEDSGQSPVVNNSDKKKNEDIHLSISQEDDSTIPKKKSDSFPRREKEGIPSSSPSSKNTIHFDKPNRKLSPAFHQALLSFCRMSADSRLGSEVSRIADSEKSVMLMLGRCLPHIVPNVLLAKREELIPLILCTACLHPEPKERDQLLHILFNLIKRPDDEQRQMILTGCVAFARHVGPTRVEAELLPQCWEQINHKYPERRLLVAESCGALAPYLPKEIRSSLVLSMLQQMLMEDKADLVREAVIKSLGIIMGYIDDPDKYQQGFELLQSALGDPSERVVSATHQVFLPAYAAWTTELGNLQSHLIPTLLNKIEKLLREGEHGLDEHKLHMYLSALQSLIPSLFALVLQNAPFSSKAKLHGEVPQIEVTRFPRPMSPLQDVSTIIGSREQLAVLLQLYDYQLEHEGTTGWESLLWVVNQLLPQLIEIVGRINVTSTACVHEFSRFFWRLCRTFGKIFTNTKVKPQFQEILRLSEENIDSTAGNGVLTKATVPIYATGVLTCYIQEEDRKLLVGFLEDVMTLLSLSHAPLDSLKASFVELGANPAYHELLLTVLWYGVVHTSALVRCTAARMFELLVKGVNETLVAQRVVPALITLSSDPEISVRIATIPAFGTIMETVIQRELLERVKMQLASFLEDPQYQDQHSLHTEIIKTFGRVGPNAEPRFRDEFVIPHLHKLALVNNLQIVDSKRLDIATHLFEAYSALSCCFISEDLMVNHFLPGLRCLRTDMEHLSPGHEVILSSMIKECEQKVENKTVQEPQGSMSIAASLVSEDTKTKFLNKMGQLTTSGAMLANVFQRKK +>XP_012931824.1_PREDICTED:_sarcoplasmic/endoplasmic_reticulum_calcium_ATPase_1_isoform_X2 +MGKVYRADRKSVQRIKARDMVPGDIVEVAVGDKVPADIRILSIKSTTLRVDQSILTGESVSVIKHTDPIPDPRAVNQDKKNMLFSGTNIAAGKAVGIVATTGVNTEIGKIRDQMAATEQDKTPLQQKLDEFGEQLSKVISLICVAVWLINIGHFNDPVHGGSWFRGAIYYFKIAVALAVAAIPEGLPAVITTCLALGTRRMAKKNAIVRSLPSVETLGCTSVICSDKTGTLTTNQMSVCKMFIVDKVDGDICLLNEFSITGSTYAPEGEVMKNDKPVRAGQYDGLVELATICALCNDSSLDFNEAKGVYEKVGEATETALTTLVEKMNVFNTDVRSLSKVERANACNSVIRQLMRKEFTLEFSRDRKSMSVYCSPAKSSRASVGNKMFVKGAPEGVIDRCNYVRVGTTRVPLTGPVKEKILSVIKEWGTGRDTLRCLALATRDSPPKREEMVLDDSSKFMEYEMDLTFIGVVGMLDPPRKEVTGSIQLCRDAGIRVIMITGDNKGTAIAICRRIGIFSESEEVTDRAYTGREFDDLPLAEQRDACRRACCFARVEPSHKSKIVEYLQSYDEITAMTGDGVNDAPALKKAEIGIAMGSGTAVAKTASEMVLADDNFSTIVAAVEEGRAIYNNMKQFIRYLISSNVGEVVCIFLTAALGLPEALIPVQLLWVNLVTDGLPATALGFNPPDLDIMDRPPRSPKEPLISGWLFFRYMAIGGYVGAATVGAAAWWFLYADDGPHVSYYQLTHFMQCTEHNAEFGGLDCEVFEAPEPMTMALSVLVTIEMCNALNSLSENQSLVRMPPWVNVWLLGSICLSMSLHFLILYVDPLPMIFKLQPLTVTQWLMVLKISLPVIGLDEILKFVARNYLEDPEDERRK +>XP_012926870.1_PREDICTED:_hemK_methyltransferase_family_member_2_isoform_X3 +MAARSFPTPLHGHVGRGEFSDVYEPAEDTFLLLDALEAAAPELAGVEICLEVGSGSGVVSVFLASMIGPQALYMCTDVNPEAAACTLETAHCNRVHIQPVITDLVKGLLPRLKEKVDLLVFNPPYVVTPPEEKKF +>XP_012924189.1_PREDICTED:_serine/threonine-protein_kinase_WNK1_isoform_X5 +MSGGAAEKQSSTPSSLFLSPPAPVSKNGSSSDSSVGEKLGSAATDAGPGRTEEYRRRRHTMDKDSRGAAAATTTTTTEHRFFRRSVICDSNATALELPGLPLSVPQPGAPAAVPQSAPAEPHREETLTAAVASQVAQQAPPTAAPGDQAASGPAAPTVPSSTNKDRPVPQPSLVGSKEEPPPAKIGSGSGGGGSAKEPQEERGQQQDDIEELETKAVGMSNDGRFLKFDIEIGRGSFKTVYKGLDTETTVEVAWCELQDRKLTKSERQRFKEEAEMLKGLQHPNIVRFYDSWESTVKGKKCIVLVTELMTSGTLKTYLKRFKVMKIKVLRSWCRQILKGLQFLHTRTPPIIHRDLKCDNIFITGPTGSVKIGDLGLATLKRASFAKSVIGTPEFMAPEMYEEKYDESVDVYAFGMCMLEMATSEYPYSECQNAAQIYRRVTSGVKPASFDKVAIPEVKEIIEGCIRQNKDERYSIKDLLNHAFFQEETGVRVELAEEDDGEKIAIKLWLRIEDIKKLKGKYKDNEAIEFSFDLERDVPEDVAQEMVESGYVCEGDHKTMAKAIKDRVSLIKRKREQRQLVREEQEKRKQEESNLRQQVEQQSSASQTGIKQLPSASTGIPTAPATSASVSTQVEPEEPEADQHQQLQFQQPSISVLSDGTVDSGQGSSVFTDSRVSSQQTVSYGSQHEQAHSAGTVPGHTAATVQAQSQPHGVYPPSSMAQGQSQGQPSSSSLAGVPSSQPIQHPQQQQGIQQTALPQQTVQYSLTQTATSSEATTAQPMIQPQTSQVLPQVSTGKQLPVSQPAPTVQGEPHISIATQPSVVPVHSGAHFLPVGQPLPTSLLPQYPVSQIPISTPHVSTAQTGFSSLPITMAAGINQPLLTLASSATSAAIPGASTVVPSQLPTLLHPVTQLPSQVHPQLLQSAVQSMGIPANLGQAAEVTLPSGDVLYQSTQGVSQVAPPEPVPVTQPQPIQPVNLVSSVDSAHSDVASGMSDGNENAPSSSGRHEGRTTKRHYRKSVRSRSRHEKTSRPKLRILNVSNKGDRVVECQLETHNRKMVTFKFDLDGDNPEEIATIMVNNDFILAIERESFVDQVREIIEKADEMLSEDVSVEPEGDQGLEGLQGKDDYGFSGSQKLEGEFKKPIPASSMPQQIGVPASSLTQVVHSAGRRFIVSPVPESRLRESKVFTSEISDTVATPTSQGPGMNLSHSASSLSLQQAFSELKRAQMTEGPSTAPPDFSQMGPTFPPFLASTAGGPPTTAAPTPSISVPITSSPLNDVSTSVVQPEVIAPTEKGIAGVATSTRVVTSSGLSEPPVSESPILSSVVSSITVPAVVSVPTTSHPVQASTSGSTVPSIGTFCPITVPTTSASALGSAAASGAKPPNMFSQQAVGSTPETATVTSVSATTLLPSIVSQPSLLSSTSATTIAETVVSAQLLDKTPNSSATGLALSFSAPSSSSPGIGVATSVSQPGGLHPLAIPSSVASIPVLAQATGPISTPLLPQVPSIPPLIQPVSSVPAVQQTLIHSQPQPALLLSQPHMHCPEIDTDTQPKAPGIDDIKTLEEKLRSLFSEHSSSGAQHASVSLETSLVVETTVTPGIPTTAVAPSKLMTSTTSTCLPPTNLPLGTTGLSGMPVVTPGQVSTPGSYISAPVTTASGMKPGTAPSKASLTKAPVLSVGTELPAGTLPSEHLPPFPGPSLTQSQQPLEDLDAQLKRTLSPETLTVTSASGPVSVVAPTAATEAGAQPQKDVSQGTEGLVPVTSPGAGVLKMGRFQVSIAKDDAQKESKDKSEDAKSVHFESSTSESSVLSSSSPESTLVKPEPNGITIPGISSDVPDSTHKTPASEAKLEARQPTKVGRFQVTTTANKVGRFSVSRTEEKITEAKKEGSETSPFRDLEQAVLPAVIPKKEKPELSEPSHLNGPSSDLEAAFLGRDVDDGSGSPHSPHQLCSKSLPPQTLSQSLSNSFNSSYMSSDNESDIEDEDLKLELRRLREKHLKEIQDLQSRQKHEIESLYTKLGKVPPAVIIPPAAPLSGRRRRPTKSKGSKSSRSSSLGNKSPQLSGNLSGQSTASVLHPQQTLHPPGNLPDTGQNQLLQPLKPSPSSDNLYSAFTSDGAISVPSLLGPGQGTSSTNTVGGTVNIQAAQAQPPAITSSRKGTFTDDLHKLVDNWARDAMNLSGRRGSKGHMNYELFCSQGPGMARKFSAPGQLCISMNSNLGGSAPISAASATSLGHFTKSMCPPQQYGFPPTTFGPQWSGTGGPAPQPLGQFQPVGTASLQNFNISNLQKSISNPPGSNLRTT +>XP_012931925.1_PREDICTED:_interferon_regulatory_factor_5_isoform_X1 +MNQQPPGAPSQPRRVRLKPWLVAQVNSCQYPGLQWVNGERKLFYIPWRHATRHGPSQDGDNTIFKAWAKETGKYTEGVDEADPAKWKANLRCALNKSRDFCLIYDGPRDMPPQPYKIYEVCSNGPAPTESQPTEDYNVVPEEEKEEEEEEELQKMLPELRLTEAVQPGPSMAPYSLPKEDVKWPPVLPPPVGPALDPNLLVPAPGNPASFGQHLPEVLPSSEPLAPTLPPASEQLLPDLLISPHMLPLTDLEIKFQYRGRPPQALTISNPQGCRIFYSQLQATQEQVELFGPVSLEQVRFPSPEDIPSDKQRFYTNQLLDVLDRGLILQLQGQDLYAIRLCQCKVFWSGPCASTQGSSPNPIQREVKTKLFSLEQFLNDLILFQKGRTDTPPPIEIFFCFGEEWPDRKPREKKLITVQVVPVAARLLLEMFSGEFSWSADSIRLQISNPDLKDRMVEQFKELHHIWQAQQQLQPMAHGPPVAGLSAGQGPWPMHPVGMQ +>XP_004846985.1_PREDICTED:_helicase_SKI2W_isoform_X1 +MIETERLVLPPPDPLNLPLRAVELGCTGRWELLNVPGPPESTLPHGLPPCAPDLQQEAEQLFLSSPAWLPLHDVEHAARKWQRETDPWSLLAAVGAPVPSDLQAQRHPTTGQVLGYKEVLLENTNLSATTSLSLRRPPGPVSQSLWGNPTQYPFWPGGMDEPSLMDLSSREEHEEELDFEKDLLTVPPGFKKGVDFAPQDRPAPAPGLLSLSCLLEPLDLGGGDVEENEAVGQTEGPRGDAASASPCRAPLARASSLEDLVLREAATAPPEPPQPPLQEQWAVPVDVTSPVGDFYRLIPHPAFQWAFEPDVFQKQAILHLEKHDSVFVAAHTSAGKTVVAEYAIALAQKHMTRTIYTSPIKALSNQKFRDFRNTFGDVGLLTGDVQLHPEASCLIMTTEILRSMLYSGSDVIRDLEWVIFDEVHYINDAERGVVWEEVFIMLPDHVSVILLSATVPNALEFADWIGRLKRRQIYVISTLTRPVPLEHHLFTGNSPKTQGELFLLLDSRGAFHTKGYYAAVEAKKERMSKHAQTFGAKQPGRQAGPAQDRGVYLSLLASLRARAQLPVVVFTFSRGRCDEQASGLTSLDLTTSSEKSEIHLFLQRCLARLRGSDRQLPQVLHMSELLHRGLGVHHSGILPILKEIVEMLFSRGLVKVLFATETFAMGVNMPARTVVFDSMRKHDGSAFRDLLPGEYVQMAGRAGRRGLDPTGTVVLLCKARVPEMADLHRMMMGKPSQLQSQFRLTYTMILNLLRVDALRVEDMMKRSFSEFPFRKDSKAHEQTLAELTKKLGSLEEPDVTGQLADLPDYYGWGEELVETRSRIQQRILESVNGLKSLSVGRVVVVKSQEHHNALGVILQVSSSSASRVFTTLVLCDKPESQGLQDRGLATPTADVPHPDDLVGFKLFLPEGPCDHTVAKLQPADVAAITTKVLRVHGEKILEDFSKRQQPKFRKDPPLAAVATAVQELVRLAQACPAGPPTLDPVSDLQLKDVSVVEGGLRARKLEELIRGAQCVHSPRFSAQYVKLRERMRIQKEMARLRFLLSDQSLLLLPEYHQRVEVLRTLGYVDEAGTVKLAGRVACAMSSHELLLTELMFDNALSALRPEEIAALLSGLVCQTPGDPGDHLPSTLKQGVERVRAVAKRIGEVQVACGLNQTVEEFVGELNFGLVEVVYEWARGMPFSELAGLSGTPEGLVVRCIQRLAEMCRSLRGAARLVGEPVLGAKMETAATLLRRDIVFAASLYTQ +>XP_004842267.1_PREDICTED:_protein_BTG3 +MKNEIAAVVFFFTRLVRKHDKLKKEAVERFAEKLTLILQEKYKNHWYPEKPSKGQAYRCIRVNKFQRVDPDVLKACENSCILYSDLGLPKELTLWVDPCEVCCRYGEKNNAFIVASFQNEDENKDDISKKVTRALDKVTSDYHSGSSSSDEETSKEVEMKPSPLTATPSPVYQISELIFPPLPMWQPLPRKKPGMYRGNGHQSHYPPPVPFGYPNQGRKNKPYRSIPVTWVPPPGMHCDRNHWINPHMLAPH +>XP_004843204.1_PREDICTED:_kinesin-like_protein_KIFC3_isoform_X3 +MVPSPRTRNLGATPSLPGPRRVGRAGEPPEPKMARPAPAPASPAARPFSHTGSGRLRTGRGKDTVVGSDEDSSARIAARPALGQCRTLSGDWAGPGSPRRLYLTVRQALQDKGCKSKSQGTKEDNLPKRQALVPRRDREALKAGAATNVEKTGGRLFGKGRCSSLPGSPGAAPEVHRMVEAMSQLQKEKAQLQEELAVLRERLALHDSDQQTTTTQLQNQVENLKEKLVSQAQEVTRLRSELGGTELEKQRRDPLMVENERLRQELGRYEAELQELCAQPAATPCLGCKHSQESTQLRHKVSQLQLEVAENKGMLSELNLEVQQKTDRLAEVELRLKDCLAEKAQEEERLSRRLRDSHETIASLQAQSPPVKYVTKTVEVESSKTKQALSESQAQNQHLQEQVAMQRQVLKEMEQQLHSSNQLTTQLRAQISMYETELERAHGQMLEEMQSMEEDKNRAIEEAFARAQVEMKAVHENLAGVRTNLLMLQPALRTLTNDYNGLKRQVRNFPMLLDEALQSAKAEIDQIIEEVNSNNHDLLRKYRRELQLRKKCHNELVRLKGNIRVIARVRPITKEDGEGPDATNVVSFDPDDDAIIHLLHKGKPVSFELDKVFSPQASQQDVFQEVQALITSCIDGFNVCIFAYGQTGAGKTYTMEGTPENPGINQRALQLLFSEVREKASDWEYTITVSAAEIYNEILRDLLGTEPQEKLEIRLCPDGSGQLYVPGLTRFRVQSVADINKVFEFGYANRTTEFTNLNEHSSRSHALLIVTVQGRDCSTGIRTMGKLNLVDLAGSERVGKSGAEGSRLREAQHINKSLSALGDVIAALRSRQGHVPFRNSKLTYLLQDSLSGDSKTLMVVQVSPVEKNTSETLYSLRFAERVRSVELGPGSRRTELGSWSSQEHLELEPTCQTPQPTARAHSAPGSGTSSRPGSIRRKLQPSA +>XP_012929325.1_PREDICTED:_DNL-type_zinc_finger_protein +MLRKALGRIPVRLGGVRPWEPGLRRLWVRPAHPEAAGRRRAWAWGRGWRHLSCGPESAAGLGRLEATHYQLVYTCKVCGTRSSKRISKLAYHQGVVIVTCPGCQNHHIIADNLGWFSDLDGKRNIEEILAARGEEVHRVAIEGALELIVEMAGAPKSPVGLKEGDSEDPTHAGEMERS +>XP_004840254.1_PREDICTED:_histone_deacetylase_complex_subunit_SAP25 +MLPWPAGTGKEAAPELAGSDQGEACSSREEALRGPGKPPQDSLQPTALRPAGPRRRQLLPRYPPGLAPEGSPRIPVPLSPQVPSSGMTLFSPWDPNFGAKARPQPVWTPSCGPGASFSGRTLCHPSFWPMYEAWGRGRRHQAPSLGCQNGQQAPRDAGFPVMCSEDVFFLDPLLPPGQHVPLYLSEAPQQALGSMKLQLPPPIMSPSVYPSQPRGCCMAQLSGPELIAITSLLQMSQGEPRPGSSGAPPSPAGPLEPISDHQSSSGSTDPSLPRPSDTHCP +>XP_004852319.1_PREDICTED:_uncharacterized_protein_C11orf86_homolog +MRTGLRSCSLQGRPSYGKLREGQLWRALSLRRGRKSRSQGLDGGPEGLEASAQEKLPGSLGDTEQLIQAQRPGSRQWLKQYQQQVRRRWESFVASFPQVTLSQSASL +>XP_004849019.1_PREDICTED:_calcium_channel_flower_homolog_isoform_X1 +MSGSGGPGAPAGPAPPAQEEGMTWWWRWLCRLSGVLGAVSCAVSGLFSCITIHPLNIAAGVWMIMNAFILLLCEVPFCCQFVEFANAVAERVDQLRSWQKAVFYCGPVKTLTSFRIKFRGQVSDQFKDLLKPAVNLMAVVPIIMSLTLTTLLGNAVAFATGVLYGLSALGKKGDAISYARIQQQKQQVDEEKLVETVEGEL +>XP_012930018.1_PREDICTED:_brain-derived_neurotrophic_factor_isoform_X2 +MTILFLTMVISYFGCMKAAPMKEASVRGPGSLAYPGVRTHGALDSVTGPKVGARGLAASSSSSSLADTFEHVIEELLEEDQKVRPHEENAKDADLYTSRVMLSSQVPLEPPLLFLLEEYKNYLDAANMSMRVRRHSDPARRGELSVCDSISEWVTAADKKTAVDMSGGTVTVLEKVPVSKGQLKQYFYETKCNPMGYTKEGCRGIDKRHWNSQCRTTQSYVRALTMDSKKRIGWRFIRIDTSCVCTLTIKRGR +>XP_012929288.1_PREDICTED:_ectonucleoside_triphosphate_diphosphohydrolase_8_isoform_X3 +MGLSCKERIFMVLLGVATASGLTVLVLLLVEATSVLLPAETKFGIVLDAGSSHTSLFVYQWPSDKEKDTGVVSQALACQVEGPGISSYALNPVRAGESLKDCLEEALALVPRGQHQETPTFLGATAGMRLLRQKNSSQAGDILEAVSQVLGRSPLDFRGAEVLAGQDEGAFGWITVNYLLGRLVQYSSGQWTQPAEGMLLGTLDMGGASTQICFAPSGPILDQSSQATFHLYGANYSVYTHSHLCFGRDQVLLRLLAGLLQSSPASLLRHPCYHSGYQTTLPLATLSESPCVRTAAPLDPTQNLTIEGTGNPGACVTALRGLFNFSCQDHGACAFDGVYQPPVQGQFYVSTGAPSLWARHHWPQDGPQEPWGAQGHRCGRHSFSHPVGILQLLLHLPLPEPHLQAAAGHCQCHGLEILPEALEAGGDQLPWAGALVARLLCLGPVHPHTAAGRLWLPRGELAQHRVPEAGRRDGHWLDAGLHAQPDWHDPSRGTR +>XP_004845071.2_PREDICTED:_pleckstrin_homology-like_domain_family_A_member_1 +MRRAPAAERLAELGFSPRCGRQEPPFPLGVTRGWGGWPIQKRREGARPVPFTERSQEHGRGQAARTSGTWWHIRTRLQLCRDPEPPPLCLLRVSLLCALRAGGRGSRWEEDGARLLLLPPARAAGSGEAEPIGGPPYAGRMLESSGCKALKEGVLEKRSDGLLQLWKKKCCILTEEGLLLIPPKQLQHQQQQQQQPGPGTPEPSQPSCPAVAGLEPPVKLKELHFSNMKTVDCVERKGKYMYFTVVMAEGKEIDFRCPQDQGWNAEITLQMVQYKNRQAILAVKSTRQKQQHLVQQQPPQPQIQPQPQPQPQPQPQPQPQLQPQPQAQPQPKPQPQQLHAYSHPHSHPHPHQHQHPHPLPHPHQPPHSQPLSQPHGHRLLRSTSNSA +>XP_004847201.1_PREDICTED:_trem-like_transcript_4_protein +MTWRGPELMLLPLLLVLLASALGAVARPGCDRGRTCCPGSRVSAAVPKELHAVVGQTLSVRCQYTPQTGPYLRKSWCCQTEEKRCSRVVTTSQPWTTVEELRYTIWDDPHAGFFVINMSDLKEDNSGKYWCGNYNVSINTIFILRNITLVVSPGETSLGKPLVASPEGTPGLSINGSEHSNSSGPFPPDAASPELLFLLQGGLLAVKGLLLSALCTVLCCRDLASFHLPQPDTRIPAFA +>XP_004852934.1_PREDICTED:_protein_FAM154B_isoform_X2 +MRSRCLCQICTCGSDYRPYEIVKQLRHIPEEYKPKQGKIDLGTTYKRDFTSYKVQPVAILRPLERQIKKGKLDTVPTYKDDYRSWDIQKNELHKPEQTYQPSPVKFGNSTTFQDDYVPRETKPRESFKPSSVVRRSTAPFNGDTSHRLDYIPHQLEVKFVRPKQVYKPTDLPFEKLTTHRNDFQGLVGETAKLCRPAYTRVAHDAHFEGSTEFRESFQAWEIPPPKVKKVPEYVPPIGSMQLHSTSHLDYIPYQASRVVPIRPVSHRRNNFPFQGKTTMKEDFPAWESCRPGLIKQEQQIPNPSGKFDGLSTSRSHYVPHELIPTESCRPLNAALKSSVPFDDVTMYSIEYAPKKQEICPASYPTPPGYIFENTDFHGHKFFHKITPAVKAF +>XP_012933047.1_PREDICTED:_G_patch_domain-containing_protein_8_isoform_X2 +MGMGRMEMELDYAEDATERRRVLEVEKEDTEELRQKYKDYVDKEKAIAKALEDLRANFYCELCDKQYQKHQEFDNHINSYDHAHKQRLKDLKQREFARNVSSRSRKDEKKQEKALRRLHELAELRKQAECAPGSGPMFRPTTVAVDEDGGDEDKDESATNSASGAAAGCSLGPEFSTEKGGPFTTVAGTGSTGLPQASGPAAPSVSFGFKNNQGTPLQKLGVSFSFAKKAPVKLESIASVFKDHAEEGSSEEGTKPDEKGSDQGLQKAGDADGGGSTDGKKEDEDPQDGAALASTLSKLKRMRREEGAGVVEPEYYHYIPPAHCKVKPHFPFLLFMRASEQMEGEASSHPKGTPDSKKSGSPKPKGCVRAAPSQAAEPGASERLEPPKEPKETKEATAVAGAEPAQPRGKAEARKVPSGFPGEQGRPVSEAQVRQPEPAKEPSAPGDSVAGRDSQGRPRHPTGPFFPVLSKDESTALQWPSELLIFTKAQPSVSYSCNPLYFDFKLSRNKDARAKGAERAKDAGGPSREALPGPEASGPGGDKDAGEPQADGGPPAAAAAPLAPAREPEPEPQDTGQSLAGRKERRGRTHRHKKRKKHKKSGRHKRRHKADADEKGSGSRADPGDKSRKRKKRKRKKKSGGAADSERGPKPEPPGSGSPAPPRRLRRHDESQRRPLPAADESGGGQRDAGGGAQERGGRRQPGEPPATSCQRRASAPRTGNTHRHGRPSSGEEDSDGGAARRPRQESPAQYSDEDDDDEEEEDSGSARSRSRSRSRRRSSRRSYSSSSAASSDQSCYSRPRSYSDDSYSDYSERSRRHSKRSHGSDDSDYASPKRRKYSSSEDDDYSLSGSPSRSRSRSRSRERSPTRSRSSSHSRSQRRSRSTTAHSWQRSRSYSRDRSRSTRSPSQRSGSRKGSWGHDSPENRRSSRRDFIRSKIYRSQSPHYFWSGRGDCPGKKDDSQGDDSKASGPPSQNSSTGTGRGSESDCGPEDKNSVTARLLLEKVQSRKGERKPSMGEEVLATPNKAGLKLKDPPQGYFGPKLPPSLGSKPVLPLIGKLPTTRKPNRKCEESGVEKGEEQDQSETEEGPPGSGCQVPAEDTAGPLSELPPGEPTSKEATAAYPVAPLGAPAHSDCYPGDPASSHSYLPDPSNGDTLEPPESGSQPGPVDAGLLPAAPDLEHFPGYAPPSREPRGESPEGAEDASLAPLESQPITFTPEEMEKYSKLQQAAQQHIQQQLLAKQAKAFPASAALAPAAPALQPIHIQQPAAASATSITTVQHAILQHHAAAAAAAAIGIHPHAHPQPLAQVHHIPQPHLTPISLSHLTHSIIPGHPATFLASHPIHIIPASAIHPGPFTFHPVPHAALYPTLLAPRPAAAAATALHLHPLLHPIFSGQELQHPPSHGT +>XP_012928014.1_PREDICTED:_protein_phosphatase_1_regulatory_subunit_29 +MLRLGLCAAALLCVCRPGAVRADCWLIEGDKGYVWLAICSQNQPPYETIPQHINSTVHDLRLNENKLKAVLYSSLNRFGNLTDLNLTKNEISYIEDGAFLGQSSLQVLQLGYNRLSNLTEGMLRGMSRLQFLFVQHNLIEVVSPTAFSECPSLISIDLSSNRLSRLDGATFASLASLMVCELAGNPFNCECDLFGFLAWLVVFNNVTKNYDRLQCESPREFAGYPLLVPRPYHSLNAITVLQAKCRNGSLPARPVSHPTPYSTDAQREPDENSGFNPDEILSVEPPASSTTDATTGPAIKLHHVTFTSATLVVIIPHPYSKMYVLVQYNNSYFSDVMTLKNKKEIVTLDKLRAHTEYTFCVTSLRNSRRFNHTCLTFTTRDPVPGDLAPSTSTTTHYIMTILGCLFGMVIVLGAVYYCLRKRRMQEEKQKSVNVKKTILEMRYGADVDAGSIVHAAQKLGEPPVLPVARMSSIPSMIGEKLPTSKGLEAGLDTPKGATKGNYIEVRTGAGGDGLARPADDLPDLENGQGSAAEISTIAKEVDKVNQIINNCIDALKLDSASFLGGSSGGGDPELAFECQSLPAATATSTAAAPGALERPSFLSPPYKESSHHPLQRQLSADAAVTRKTCSVSSSGSIKSAKVFSLDVPDHPAASGLAKGDSKYIEKGSPLNSPLDRLPLVPTGSSGGSSGGGGIHHLEVKPAYHCSEHRHSFPALYYEEGPDSLSQRVSFLKPLTRSKRDSTYSQLSPRHYYSGYSSSPEYSSESTHRIWERFRPYKKHHREEVYMAAGHALRKKVQFAKDEDLHDILDYWKGVSAQQKL +>XP_012924869.1_PREDICTED:_tetratricopeptide_repeat_protein_6-like +MSWNRSEMTMFTLLAKAQMKAKKIKEAVRMFKKALEVFSHSDKGPNAVAISVDCLHNLGLCYMEEGNLQMAFDCFTKAVKANPDFAEGFYQRGLCKVKLQGDNSILDFNRAIALNPRHYQAYLRRVAFYGLKGRYSKAILNCNEAIKIYPQSVCAYLCRGVLKYYSMNYKLAIRDLTIAVNMDKSSYAAFYNRALCYTKIRELQMALIDFGIVLLLDAGETITLNTFINRGLIYTKLEQYGFALEDFKQAASISQTDVSLCQASAMCHHRIQEFKEATDFFTQALKINPLFLDAYTGQRNSYMGYGHEATKQAQKDFLKALHLNPLCTKARISLCYNLQAQGKLQKAWKHFTITMEIDPNSYLAYEGRAVVCLQMGINFAAMQDINAAIKINTTAEFLTNRGVIHEFMGQQQSVMKDYQAAIALDPKYSLAYFNAGNIYFHHRQFSQASDYYSKSLKFDPENEYVLMNRAITNTILNKYEEAKEDFAYVIERCPFWAAVYFNRAHLYCCLKQYDLAEEDLSRALSLKPNDVLVCNLRAEVRGKMGLIEEAMADYNQALDLEEYASVT +>XP_004859657.1_PREDICTED:_sorting_nexin-11_isoform_X2 +MLENPEQEEVITVRVQDPRVQNEGSWNSYVDYKIFLHTNSKAFTAKTSCVRRRYREFVWLRKQLQRNAGLIPVPELPGKAPFFGSSDEFIEKRRQGLQHFLERVLQSVVFLSDSQLHLFLQSQLSVPEIEACVQGRSPTTVADAILLYAMSNCGWAQEERLGVAGQAQGDQPNSCCFLPRSGRRASPSPPPRDGQDRLAVWAPVVDSEAPSLESPALPLSSSPPCCGCTRPDTDEGRCAPQPARTAEGADHAVPLDAGQLDAVWEN +>XP_012927920.1_PREDICTED:_microtubule-associated_protein_4_isoform_X16 +MADLSLADALTEPPPEIEEEIKRDFMATLEAEAYDDVVGETVGKTDYIPLMDGDEKTGSLESKRKPCSDTSQVEGTPSSKPTVLANGDHAIEGNDTTGYPAGFLDETMTFQEYQNSQNWPEDADFCFQPGEVVNPIQTDPFKMHHDDNLADLLFLSSGTTNVPVLMGQNDPQEDSYDMSSCDTFAPATIAPHGWSMPAPNSAHSESFVSPEDFGEPPQPAAELAKEIDLPSVEEQLLTNALDIMTGQKSTDMAPSRETEVVLANVMGPATETKVASAKGTEQPSKLDVALVENTQPSIESDTSLAKDMALLTETQAAAMKDMVLPTEPEAAPSKGVTESTPLVPKDLAPQQAIVPPTDTQITVAMGVMSLSETEAELAKDSVSSMEISPAMEMALSSEAEVALARDVALSPEALVVFTEDVALSLGTEGASVKDMAPPLETEMGLGKDMTSPLESKVGLGKDMAVLQETEMAPTKDMATPQETEVALGNDVILPPDAEVSQVKDVTPLLEKDAALPPQTKVALGKDAVLPSGTDVMLANNVTPVKDVTPPLETEVAAVLKDTEMAQSQKGLSEDPQLESLQSEAPAAPGLISAEPIKASGQKYSLPTDEDFGLEKLEQKKPLNSQPSEPSSATSGIARPEEGKAAVSVTGNDISTPPNKELPPSPEKKAKPLATIQPAKTATSKAKTQLTPVPKQPAPATSGGANKKPMSLASGLVPAAPPKRSAAATARTSTLSSRDAKPKHIAEAKVSEKQALPSKPASALTLRPGPKTTSAAPKVESAAAPASLGPSSRSPPALLSKRPAAIKTEGKPADAKKTVAKSAPADLSRSKSIPTSSVKKTTTHAGAAPTAAAALTRVKPTPLSRPTMSPSMDKKPTTTKPSSSAPKLSRPATAAPAPDLKNVRSKVGSTENIKHQPGGGRVQIVSKKVSYSHIQSKCGSKDNIKHVPGGGNVQIQSKKVDISKVSSKCGSKANIKHKPGGGDVKIESQKLNFKEKAQAKVGSLDNVGHLPAGGSVKTEGGGNEAPPCPGLPAGEEPAGSEAAPDAGAPTPAGGLSGLPTLSGGGDQREAQTLDSQIPETMSRKPEDPQRPT +>XP_004865045.1_PREDICTED:_lysophospholipid_acyltransferase_LPCAT4 +MRQGSPGDSAPREPAPGDPALPNPFVHELHLSRLQQVKFCLLGVLLAPIRVLLAFIILFLLWPFAWLQVAGLTEEQLQEPITGWRKTVCHNGVLGLSRLLFFLLGFLRIRVRGQRASRLQAPVLVAAPHSTFFDPIVLLPCDLPKVVSRAENLSVPVIGALLRFNQAILVSRNDPASRRRVVEEVRRRATSGGKWPQVLFFPEGTCSNKKALLKFKPGAFIAGVPVQPVLIRYPNSLDTTSWAWRGPGVLKVLWLTASQPCSIVDVEFLPVYQPSPEESRDPTLYANNVQRVMAQALGIPATECEFVGSLPVIVVGQLKVALEPQLWELGKVLRKAGLSPGCVDTGAEPGRSRMISQEEFARQLQLLDPQTVAGAFSYFQQDSSGLVDFRDVALALAALDGGRSLEDLTHLAFELFAEEQAEGSGRLLYQDGFSTILHLLLGSPRPAAMTLHAELCQAGPSHGLSLDQFQNFSLRDLLYGKLFSTYLRPPHTPRGTSQVPDASSPQSPSALANGTLQAPKQKED +>XP_004864008.1_PREDICTED:_sialin_isoform_X2 +MRPSASRLAASYGEDGADSTPLLLGARRADAAPVCCSARYNLAILSFFGFFVLYALRVNLSVALVEMVDSNTTAADNRTSKECAEHSDLVKVPHNQTGKRYPWDAETQGWILGAFFYGYIITQIPGGYFASKIGGKLLLGYGILATSLFTLLTPIAADLGAVMLIMLRALEGLGEGVTFPAMHTMWSSWAPPLERSKLLSISYAGAQLGTVVSLPLSGIICYYMNWTYVFYFFGILGILWFILWTWKVSDTPETHKTISSYEKEYITSSLKSQLSSRKSVPWIPILKSLPLWAIVMAHFSYNWTFYTLLTLLPTYMKEILRFNVQENGFLSALPYFGSWLCMILSGQAADSLRAKWNFSTLCVRRTFTLIGMIGPAVFLVAAGFIGCDYSLAVTFLTISTTLGGLCSSGFSINHLDIAPSYAGILLGITNTFATIPGMVGPVIAKSLTPEDTITEWQTVFYIAAAINVFGAIFFTLFAKGEVQIWAFGDHHGHRN +>NP_001280672.1_antizyme_inhibitor_2 +MAGYLSESDFVMVEEGFSTRDLLEELTLEASQATTGEVAAFFVANLGAIVRKHFCFLKCLPRVRPFYAVKCNSSLGVLKVLAELGLGFSCVNKAEMELVQRVGVPASKIIYANPCKQIAQIKYAAKHGVQLLSFDNEVELAKVVKNHASAKMVLCIATDDTHSLSFLSLKFGALLKSCRHLLENAKKSHMEVVGVSFHVGSGCPDPQVYAQSIAEARLVFEMGAELGHTMHILDLGGGFPGVERTKVRFEEIASVINSALDLYFPEGCGVDILAELGRYYVTSAFTVAVSIVAKKEVLLDQPNREEENGSALKTIVYHLDDGVYGIFNSVLFDNICPTPLLQKKPPTEQPLYSSSLWGPAADGRDCVAEGLWLPQLHIGDWLVFENMGAYTVGTGSLLGGTQTCHITYAMSRVAWEALRGQLLPVEQDEDAEGVCKPLSCGWEITDTLCVGPVFTPASIM +>XP_004840043.1_PREDICTED:_DNA-directed_RNA_polymerase_III_subunit_RPC9_isoform_X2 +MEVKDGNSVLLSNYEVFQLLTDLKEQRRESGKNKHSAGQQNLNTITYETLKYLSKTPCRHQSPEIVREFLTAMKSHKLTKAEKLQLLNHRPVTAVEIQLMVEETEERFTEEEQIEELLHTVMSVLPAEPEAEQKTDASGDVEMNEEGRA +>XP_004850942.1_PREDICTED:_fibronectin_type_III_domain-containing_protein_5_isoform_X3 +MPPGPPCAWPPRGALRLWLGCVCFALVQADSPSAPVNVTVRHLKANSAVVSWDVLEDEVVIGFAISQQKKDVRMLRFIQEVNTTTRSCALWDLEEDTEYIVHVQAISIQGQSPASEPVLFKTPREAEKMGSKNKDEVTMKEMGRNQQLRTGEVLIIVVVLFMWAGVIALFCRQYDIIKDNEPNNNKEKTKSASETSTPEHQGGGLLRSKI +>XP_004869941.1_PREDICTED:_olfactory_receptor_1030 +MKQNYTVVTEFILLGLTDRAELQPLLFVVFLVIYIVTIIGNVTMIVLIRSDSKLHTPMYFFLSHLAFVDLCYATTVTPQMLVNFLSKRKIISFIGCMIQFNFFIAFVITDYYVLAAMAYDRYVAICQPLLYGSKMSRCVCVSLVVATYIYGFANGLVQTILMLRLTFCGPNEINHFYCADPPLMVLACSDTYVKETAMFVVAGSNLTCSLSIILVSYVFIFAAILHIRSAEGRRKAFSTCGSHLTAVTVFYGSLFCMHLRPPSETSVEQGKIVAVFYIFVSPMLNPLIYSLRNKDVKRAIRKVIQKELFVK +>XP_012931139.1_PREDICTED:_treacle_protein +MAEARKRRELLPLIYQHLLHAGYVRAAREVKEQSGQKSFLAQPFTLLDIYTHWQQTSEIGQKRKAEDDAALQAKKTRVSDPISSSESSEEEEEEEEEAEAKAAKTTPRPASTNSSAMGMVLPSSMKEKAKAKTRNTSKTVNSVPHLASGKAVVHLLSGKSPKKSAELSGSTVLVSETEEEGSIQALEAAAKPGTVSAGQADNSNKDTSSSSDETDVEVKSSVETSQVRPSLTLAKESSASKAAPSPGKVGGVARQARGGALTPAGSAVKPEEEPPTGAPSQVKASEKILQVRLAPASAKGTPGKQATCALPGKGGPLATQAKARRPEQDSESSSEGESDSEVETPPVMTALQAKLSGKTLQVRAASAPAKESPRKGHPPATPGKTGPAATQAQVGKQEEDSDSSSEESDSDGETPAAQTLAKPSGKILQVRPASGPTKGLLGKGAAPKPPQKSGPVAIQVKAEKSKDDSESSEESSDSEEEAPAAVTPAQAKPELKMPQTKASPSKSILLTPTSAKGAPVRVGTPAPWKAGTVASASSSALPRGAQRPKDNSSSSEEESEGKEATPAAAVAQAKSLGKGLRGQAASAPTMGPSGQGATPVPPGKTRPTVAQVRAEAHESSESSEEESDDSEVGAVVTPAQAKAPGKTPQAKANPASTKASTDKEAAWTPAKLVTAVVQAKPGSMAKGKSPVRAPKNSTISARGQASVPASGKAVTAAAQSQKGPTQESEEKDLESSEESSESEEELPTQAKPSGKTLQVRAATAPAKESSRKGPSPTTPGKTGPAGTQAQVGKQEEDSDSSSEESDSDGETPAAQLKPLGKTPQVKAASATANGSPRKGAPPAPPGKTGPAAIQAQVQSQLWKVLSRAEVPISGAVGHASPAAVRVHVCVQKPASRLPSANTLHMLLQVLSLQKNINSKTVGSNTLTPAPREKSPEGSSESSEEELPSSQVIKTPLIFVDPNRSPAGPAATPTQAQAASPPRKARASSSTAGSSSEGEDEDVIPATQSSTLAVRKEVVTVPTASPRMAPRASSSLESSRVSPGQKQEAAAPQVTKRNLASLPLTQAALKVLAQKASEGQPSSEAGSDAGTLPVTCPQSNPVQARVTNKLRKPKPSEGQQTTVTTSGHLKATAPGSSDNSDDSSDNSSGSEEDAEEPLMTKSAPGLGPSPSKRETLVEETTAESSEDEVVVPSQSLLSGFVTPGLTMANNRASKATARQNLHPSLSSPPPTKDDPAGKQAAESQHIAGAVSPKPGRKEAASGPTPQKPRKPKKGPLSTSASLQTLQSNITQHLQGQPWPLNEAQVQASVVKVLTELLEQERKKAEDTARESSRKGRKRKLSGDQVASRAPKGKKKKQLAAGEGREDAASSEKAPRTSKGKSKRDKASGDLKEEKGSGSGGSKDKPDGELLKVESGNQNDSKSKKEKKKSNKKKKDKEKKEKKKGKKPSAKDSDSPFQKKKKKKKKTAEQTV +>XP_004868708.1_PREDICTED:_KAT8_regulatory_NSL_complex_subunit_1_isoform_X1 +MAAMAPALTDAAAEAHHIRFKLAPPSSTLSPGSAENNGNANILIAANGTKRKAIAAEDPSLDFRNNPTKEDLGKLQPLVASYLCSDVTTVPQKESLKLQGVFSKQAVLKSHPLLSQSYELRAELLGRQPVLEFSLENLRTMNPSGQTALPQAPVNGLAKKLTKSSTHSDHDISSPLNGGKRAPTSSALQGGEVGGSDSGDLKGGMTNCTLPHRSLDVEHTTLYSNNSTANKSSVNSVEQLALQGSSRLSPGTDSSPNLGSVKLEGKKSPMSSILFSALDSDTRITALLRRQADIESRARRLQKRLQVVQAKQVERHLQHQLGGFLEKTLSKLPNLESLKSRSQLMLTRKAEAALRRAASETTTSEGLSNFLKSDSISEELERFTASGIANLRCSEKAFDSDITDSSSGGESDIEEEELSRADSEQCHIPLKRRSEWRWAADRAAIVSRWNWLQAHVSDLEYRIRQQTDIYKQIRANKGLIVLGEASPPEHTTDSLLPLGSEVKTDHGTDKLIESVSQPLENHGPSVGHISESLSAKSCGALRPVNGVINTLQPVLADHVPGDSSDAEEQLHKKQRLNLVSSSDGTCVAARTRPVLSCKKRRLVRPNSIVPLSKKVQRNSITRSGCDVNTSCALCGSGSVNTMPPEIHYEAPLLERLSQLDSCIHPVLAFPDDVPTSLHFQSMLKSQWQNKPFDKIKPPRKFSLKHRTPMQGSLTDPTRKDRHKLVNSFLTTAKLSHHQTRPDRTHRQQLDDVGAVPMVERVTVPKAERLLNPPPPVHDPNHSKMRLRDHSSERSEVLKHHTDISNSSYLATTHHTPHSPLVRQLSTSSDTSAPTSSSSQVSASTSQPVRRRRGESSFDINNIVIPMSVAATTRVEKLQYKEILTPSWREVDLQSLKENPEEENEEIEDLSDAAFAALHAKCEEMERARWLWTTSVPPQRRGSRSYRSSDGRTTPQLGSANPSTPQPASPDVSSSHSLSEFSHCQSPRSPISPELHSAPLTPVARDTLRHLASEDTRCSTPELGLDEQSVQPWERRTFPLPYSPQAECEDQLDAQERAARCTRRTSGSKTGRETEVAPTSPPIVPLKSRNLAATVTAQRPTHR +>XP_004871686.1_PREDICTED:_caspase-10 +MASRGGSLGSSSDEDSSMSFREKLLRINLSLGAQDVEGMKFLCMGLVFEKRLERSSSASDLFDLLLEEELLSEDNAFFLAELLYSIRQNSLLRHLGYTRECVEQWLPTRRRLSLFRNLLYELSEAIDSEKLKDMTFLLQDHIPKTQMTSLSLLACLEKQTLIDEDNLRLLEKVFKSVAPNLVKKIENYKRERAAQEAMPPTDRETESLHQGEEEVFSHSDIKQLVQALPEVDVYRMDRKHRGHCVIINNHSFEGLNERTGTHMDAEYLRRVFQWLGFTVHMHHDVTREGMEKILREQRSHPGHADGDCFVFCILTHGKLGAVYSSDKALIPLREITSHFTAQQCQALAHKPKLFFIQACQGEAMHPSVLIEADALNPECVSPSLQGSIPEEADFLLGLATVPGYVSFRHKEKGSWFIQSLCNHLKNLVPRRQDILSILTAVNQDVSQQADASGRKKQMPQPAFTLRKKLVFPVPSEAL +>XP_004873541.1_PREDICTED:_protein_FAM156A/FAM156B +MDPLQKWNPGLISGSSQMPTTETSQEGAAASQPSSSEQLMMGLSDLSISPGSNPAVPLQEGLFQQQHREKTLLEQHWERLGFPQKKKAFLGHFRRRHRDHMAPYPVERETRISFPGDRAQNQFRCQCRYCQGHMPNISGVTGERNGNPSPSSWETLVQGLSGLTLSLGTNRPGIQPGGVQQQQQQQQQQQQQQQQQEPEEKLQLERQQESKNMFQRLFKQWLEEN +>XP_004856768.1_PREDICTED:_transmembrane_protein_25_isoform_X7 +MCRPCVHVCVCVRVCVCVCVCVVRLRSCPLLLCTFVCDVCPLQSVLGSVPAGAQSKFLKELLGLPALTWLTPRPPHSLSRPAPALATMGLPPGPATLPHTLLFLPALLSSGWGELAPQIDGHTWAERALQENERHAFTCRVAGGPGTPRLAWYLNGQLQEASTSRLLSVGGEAFSGGTSTFTVTAHRAQHELNCSLQDPGSGRSANASVILNVQFKPEIAQVGAKYQEAEGPGLLVVLFALVRANPPANVTWIDQDGPVTVNTSDFLVLDAQNYPWLTNHTVQLQLRSLAHNLSVVATNDVGVTSASLPGPVTLTT +>XP_012931108.1_PREDICTED:_E3_ubiquitin-protein_ligase_PDZRN3_isoform_X2 +MGCSLCSLQKQEEQYKLLYEVCQVNGKDLSRATHDQAVEAFKTAKEPIVVQVLRRTPRTKMFTPPAELQLVDTGTQTDITFEHIMALTKMSSPNSPVLDPYLLPEEHPSAHEYYDPNDYMADIHQEMDREELELEEVDLYRLSSQDKLGLTVCYRTDDEDDIGIYISEIDPNSIAAKDGRIREGDRIIQINGIEVQNREEAVALLTSEENKNFSLLIARPELQLDEGWMDDDRNDFLDDLHMDMLEEQHHQAMQFTASVLQQKKHEEDGGTTDTATILSNQHEKDSGVGRTDESTRNEESSEQENNGDDATASSNPLAGQRKLTCSQDTLGSGDVPFSNESFVSADCTEVDYLGIPVDECERFRELLELKCQVKSASPYSLYYPSSPLDATKSDPESVDKELELLNEELRSIELECLSIVRAHKMQQLKEQYREPWLLHHGGFRNYNTSLDVRRHELSDITELPEKSDKDSSSAYNTGESCRSTPLTLEISPDNSLRRAAEGLSCSGSEGAGAMGTAEGYGPSPKNLLAITEDPEVGTPNYNPSAKELDPSQPLESKERRATEGGRSPLGSPKLGGAYLSSSPHSPYKHAHIPAHAQHYQSYMQLIQQKSAVEYAQSQMSLVSMCKDLASSNSSEPRMEWKVKIRSDGTRYITKRPVRDRLLRERALKIREERSGMTTDDDAVSELKMGRYWSKEERKQHLVKAKEQRRRREFMMQSRLDCLKEQQGADDRKEMNILELSHKKMMKKRNKKIFDNWMTIQELLTHGTKSPDGTRVYNSFLSVTTV +>XP_004849533.1_PREDICTED:_BMP/retinoic_acid-inducible_neural-specific_protein_1_isoform_X1 +MNWRFVELLYFLFVWGRISVQPSHQEPAGTDQHVSKEFDWLISDRGPFHHSRSYLSFVERHRQGFTTRYKIYREFARWKVRNTAIERRDLVRHPVPLMPEFQRSIRLLGRRPTTQQFIDTIIKKYGTHLLISATLGGEEALTMYMDKSHLDRKSGNATQSVEALHQLASSYFVDRDGTMRRLHEIQISTGAIKVTETRTGPLGCNSYDNLDSVSSVLLQSTESKLHLQGLQIIFPQYLQEKFVQSALSYIMCNGEGEYVCQNSQCRCQCADEFPQCNCPVTDIQVMEYTLANMAKSWAEAYKDLENSDEFKSFMKRLPSNHFLTIGSIHQHWGNDWDLQNRYKLLQSAMEAQRQKIQRTARKLFGLSVRCHHNPIHQLPRERTIQQWLARVQSLLYCNENGFWGTFLESQRSCVCHGSTTLCQRPIPCIIGGNNSCAMCSLANISLCGSCNKGYKLYRGRCEPQNVDSERSEQFISFETDLDFQDLELKYLLQKMDSRLYVHTTFISNEIRLDTFFDPRWRKRMSLTLKSNKNRMDFIHMVIGMSMRICQMRNSSLDPMFFVYVNPFSGSHSEGWNMPFGEFGYPRWEKIRLQNSQCYNWTLLLGNRWKTFFETVHIYLRSRTRLTTLLRNDTGQGPVDLSDPSKRQFYIKISDVQVFGYSLRFNADLLRSAVQQVNQSYTQGGQFYSSSSVMLLLLDIRDRINRLAPPVAPGKPQLDLFSCMLKHRLKLTNSEIIRVNHALDLYNTEILKQSDQMTAKLC +>XP_004856078.1_PREDICTED:_linker_for_activation_of_T-cells_family_member_1_isoform_X2 +MEVSSLVLTEPLGLLLLPLVAMLLMALCVRCRELPASCGGADEDRSHTESILFKPPQAPAPWPAAYPPPSQVDLLHIPRSPQPLGGSHRMLSSRQDSEGANSVASYENQEPACEDADEDDLEEEEDYPNEGYGGYVEVLPDSAPASGAADPAEAPVPSNPGARGSAFSMEFREDYVNVPESEESAEVSLDGSREYVNVSQELQPGARTEPAALSSRDVEDEDEDEDEETPDYENLQELS +>XP_012922077.1_PREDICTED:_ral_GTPase-activating_protein_subunit_alpha-1_isoform_X5 +MFSKKPHGDVKKSTQKVLDTKKDALTRLKHLRIVIENAESIDLKQFFDQHFSHIYYVFFENFVTIEASLKQKGHKSQREELDAILFIFEKILQLLPERIHQRWQFHSIGLILKKLLHTGNSLKIRREGVRLFLLWLQALQNNCSREQLWMFSCLIPGFSAPQSEHGPRTLDNLINPPLNLQETQVTIEEITPLVPPQSGDKGQEDLTSYFLEALLKYIVIQVKSLEWKNKENQERGFSFLFSHFKKYYLPYIFPNICKENSLYHPALDIPQIRPKPHYVMIKKDAETNEAIYCTKEPFIKARVIVIRWLVSFWLEPKPHAGPHIPGMEGEVLPKNIQRAAASLVSREENRNDNGDKGDRTTEPEQSHSNTSTLTEREPSSSSLCSIDEEHLTDIEIVRRVFSSKRSNVNFVTEIFRQAFLLPICEAAAMRKVVKVYQEWIQQEEKPLFMQEPEEIMITSSDIPCIENAKDHDISVEEGEKREEENGTSMAEHVRNSGWPKTGSYQDPLHNASEEATEQNIRAGTQAVLQVFIINSSNIFLLEPANEIKNLLDEHTDMCKRILNIYRYMVVQVSMDKKTWEQMLLVLLRVTESVLKMSSQAFLQFQGKKNMTLAGRLAGPLFQTLIVAWIKANLNVYISRELWDDLLSVLSSLTCWEELATEWSLTMETLTKVLARNLYSLDLSDLPLDKLSEQKQKKHKGKGVGHEFQKVSVDKSFSRGWSRDQPGQAPMRQRSATTTGSPGTEKARSIVRQKTVAMRSRSIGECALPSAYIRSAKSAPVLIHTSKPFLPDIVLTPLSDELSDIDDAQIHPRSTRVRHFSQSEDTGNEVFGALNEEQPLPRSSSTSDILEPFTVERVKVNKEDMSPKLPPLNSDIGSSSANVPDLMDEFIAERLRSGNALNMTRRGSSPGSLEIPKDLPDILNKQNQMRPIDDPGVPSEWTSPASAGSSDLISSDSHSDSFSAFQYDGRKFDNFSFGGDPGIASSADVDSFSGHHQSAEEQEVASLTTLHIDSETNSLNQQAFSAEVATVTGSESASPVHSTLGSRSQTPSPSTLNIDHMEQKDLQLDEKLHHSVLQTPDDLEISEFPSECCSVMAGGTLTGWHADVATVMWRRMLGILGDVNAIMDPEIHAQVFDYLCELWQNLAKIRDNLGISTDNLTSPSPPVLIPPLRILTPWLFKATMLTDKYKQGKLHAYKLICNTMKRRQDVSPNRDFLTHFYNIMHCGLLHIDQDIVNTIIKHCSPQFFSLGLPGATMLIMDFIIAAGRVASSAFLNAPRVEAQVLLGSLVCFPNLYCELPALHPNIPDIAVSQFTDVKELIIKTVLSSARDEPSGPARCVALCSLGIWICEELVHDSHHPQIKEALNVICVSLKFTNKTVAHVACNMLHMLVHYVPRLQIYQPDSPLKIIQILIATITHLLPSTEASSYELDKRLVVSLLLCLLDWIMALPLKTLLQPVHAAGTENDKTEKSVLNCIYKVLHGCVYGAQCFSNPRYFPISLSDLASVDYDPFMHLESLKEPEPLHSPDSERSSKLQPVTEVKTQMQQGLISIAARTVITHLVNHLGHYPMSGGPAMLTSQVCENHDNHYSESTELSPELFESPNIQFFVLNNTTLVSCIQIRSEESMPGGGLSAGLASANSNVRIIVRDLSGKYSWDSAILYGPPPVNGLSEPTSFILSLSHQEKPEEPPTSNECLEDIIVKDGLSLQFKRFRETVPTWDTIRDEEDVLDELLQYLGVTSPECLQRTGISLNIPAPQPVCISEKQENDVINAILKQHTEEKEFVEKHFNDLNMKAVEQDEPVPQKPQSAFYYCRLLLSILGMNSWDKRRSFHLLKKNEKLLRELRNLDSRQCRETHKIAVFYVAEGQEDKHSILTNIGGSQEYEDFVAGLGWEVNLTNHCGFMGGLQKNKSTGLTTPYFATSTVEVIFHVSTRMPSDSDDSLTKKLRHLGNDEVHIVWSEHTRDYRRGIIPTEFGDVLIVIYPMKNHMFNIQIMKKPEVPFFGPLFDGAIVNGKVLPIMVRATAINASRALKSLIPLYQNFYEERARYLQTIVQHHLEPTTFEDFAAQVFSPASYHHLPSDADH +>XP_012934276.1_PREDICTED:_zinc_finger_and_BTB_domain-containing_protein_44_isoform_X3 +MGVKTFTHSSSSHSQEMLGKLNMLRNDGHFCDITIRVQDKIFRAHKVVLAACSDFFRTKLVGQAEDENKSVLDLHHVTVTGFIPLLEYAYTATLSINTENIIDVLAAASYMQMFSVASTCSEFMKSSILWNTPNSQPEKSIDAGQENSNCNFTSRDGSISPVSSECSVVERTIPVCRESRRKRKSYIVMSPESPVKCSTQTSSPQVLNSSASYTENRNQPVDSSLAFPWTFPFGIDRRIQSEKTKQAENTRALELPGPSEAGRRMTDCVTCESTKASLPLGTEEDIRVKVERLSDEEVHEEVSQPVSASQSSLSDQQTVPGSEQVQEDLLISPQSSSIGSVDEGVTEGLPTLQNTSSTNVHVDDDDRTERPSPNGPDRPFQCPTCGVRFTRIQNLKQHMLIHSGIKPFQCDRCGKKFTRAYSLKMHRLKHEVIS +>XP_012922460.1_PREDICTED:_guanylate_cyclase_soluble_subunit_beta-1_isoform_X3 +MAPRRGRTSISREQVEEDHFRKKSLSKIRQRERIQQMESRRKEKEAQLDEEGQFLVRIIYDDSKTYDLVAAASKVLNLNAGEILQMFGKMFFVFCQESGYDTILRVLGSNVREFLQNLDALHDHLATIYPGMRAPSFRCTDAEKGKGLILHYYSEREGLQDIVIGIIKTVAQQIHGTEIDMKVIQQRNEECDHTQFLIEEKESKEEDFYEDLDRFEENGTQESRISPYTFCKAFPFHIIFDRDLVVTQCGNAIYRVLPQLQPGNCSLLSVFSLVRPHIDISFHGILSHINTVFVLRSKEGLLDVEKLECEDELTGTEISCLRLKGQMIYLPEADSIVFLCSPSVMNLDDLTRRGLYLSDIPLHDATRDLVLLGEQFREEYKLTQELEILTDRLQLTLRALEDEKKKTDTLLYSVLPPSVANELRHKRPVPAKRYDNVTILFSGIVGFNAFCSKHASGEGAMKIVNLLNDLYTRFDTLTDSRKNPFVYKVETVGDKYMTVSGLPEPCVHHARSICHLALDMMEIAGQVQVDGESVQITIGIHTGEVVTGVIGQRMPRYCLFGNTVNLTSRTETTGEKGKINVSEYTYRCLMSPENADPQFHLEHRGPVSMKGKKEPMQVWFLSRKNAGAEVGVETSQEDD +>XP_004864119.1_PREDICTED:_cathepsin_G +MQPLLLLLALILLPGAKAGKIIGGQEARPHSHPYMAYLQVESPEGLSSCGGFLVREDFVMTAGHCWGSAINVTLGAHNIEKQERTQQQVTVLRAIRHPRYNEKNAQNDIMLLQLRNRITRNRFVRPVALPNAREKPRPGALCTVTGWGWINLHEWSDKLQEVQLRVQSNRKCTRRFPSYSSRIQICVGDPRQRKAAFKGDSGGPLVCNSVVQGIVSYGDKERGTTPEVFTRISSYLPWINRTMRCFQTAESD +>XP_004861216.1_PREDICTED:_mitochondrial_inner_membrane_protease_ATP23_homolog_isoform_X3 +MARAGDGRGPCSAAGEQPLNQQQQQQQGTSQVYPERLAEGRPQQGLFSRFLTHNQKCQLMLLKTLETNPYVKLLLDAMKHSGCAVNKERHFSCEDCNGNVSGGFDASSSQIVLCQNNICNQAHMNRVVTHELIHAFDHCRAHVNWFTNVRHLACSETCVRDRAILSILAVRNISKEVAEKAVDEVFESCFNDHEPFGRIPHNQTYARYAHRDFQNRDRYYSNI +>XP_012929719.1_PREDICTED:_rho_guanine_nucleotide_exchange_factor_10-like_protein_isoform_X2 +MASSNPPAQPAVAKAAESLPWARPGCDCKGGQPFFPPGDLLVPAAPGPSPEVEDPGEAFEFDDSDDEEDTSTGLGVPCLAPERNEPLLIHFDSTLGSDLDPATAPPQTEVPAVVSNGDAVDVVFSGVQRSSWKRKSSRRIDRFSFPALEEDVIYDDVPCESPDAHQPGAERNLLYEDVQRAAREPEDLGWSSSEFESYSEDSGEEAKPEAEPAKHRVSFQPKLSPDLTRLKERYARTKRDILALRVGGRDMQELKHKYDCKMTQLMKAAKSGTKDGLEKTRMAVMRKVSFLHRKDVLGDSEEEDMGLLEVSVTDIKPPAPELGPMPDGLSPQQVVRRHILGSIVQSEGSYVESLKRILQDYRNPLMEMEPKALSVRKCQVVFFRVKEILHCHSMFQIALSSRVAEWDSTEKIGDLFVASFSKSMVLDVYSDYVNNFTNAMSIIKKACLTKPAFLEFLKRRQVCSPDRVTLYGLMVKPIQRFPQFILLLQDMLKNTPRGHPDRLSLQLALTELETLAEKLNEQKRLADQVAEIQQLTKSVSDRSSLNKLLTSGQRQLLLCETLTETVYGDRGQLIKSKERRVFLLNDMLVCANINFKGQLEISSLVPLGPKYVVKWNTELPQVQVVEVGQDGGAYDKDNVLIQHSGAKKASATGQAQNKVCLGPPRLFQELQDLQKDLAVVEQITLLVSTLHGTYQNLNMAVAQDWCLALQRLLRVKEEEIHSANKCRLRLLLPGKPDKSGRPISFMVIFITPNPLSKISWVNRLHLAKIGLREENQPGWLCPDEDRKSKAPFWCPILACCVPAFSSRALSLQLGALVHSPVNCPLLGFSAVSTSLPQGYLWVGGGQEGAGGQVEIFSLNRPSPRTVKSFPLAAPVLCMEYIPEPEEDPEGRQESRVSADPSAGTVHPTICLGLQDGSILLYGSVDTGTQCLASCRTPGLQPVLCLRHSASYLLAGLQDGTLAAYPHSSGGVPWDLESLPMCLTVGPGPVRTLLSLEDAVWASCGPRVTVLDGTTLQTQQSFDAHQDEEVSVTHMVKAGSGVWMAFSSGSSIRLFHTETLEHLQEINIATRTTFLLPGQKRLCVTSLLICQGLLWVGTDQGVIVLLPVPRLEGIPKITGKGMVSLNGHCGPVAFLTVATSILAPDILRSDQEEAEGPRAEEDKLDGQGQELAPAPNSHMGRELTRKKGILLQYRLRSTAHLPGPLLSMREPEPGDSSALEHSEEDGSIYEMADDPDVWVRSRPCTRDAHRKEICSVAIISGGQGYRNFGSALGSSGKPALCGDSDSTLLIWQVPLML +>XP_004839118.1_PREDICTED:_rho-related_GTP-binding_protein_RhoB +MAAIRKKLVVVGDGACGKTCLLIVFSKDEFPEVYVPTVFENYVADIEVDGKQVELALWDTAGQEDYDRLRPLSYPDTDVILMCFSVDSPDSLENIPEKWVPEVKHFCPNVPIILVANKKDLRSDEHVRTELARMKQEPVRTDDGRAMAVRIQAYDYLECSAKTKEGVREVFETATRAALQKRYGSQNGCINCCKVL +>XP_004865105.1_PREDICTED:_ras-related_protein_Rab-2B +MTYAYLFKYIIIGDTGVGKSCLLLQFTDKRFQPVHDLTIGVEFGARMVNIDGKQIKLQIWDTAGQESFRSITRSYYRGAAGALLVYDITRRETFNHLTSWLEDARQHSSSNMVIMLIGNKSDLESRRDVKREEGEAFAREHGLIFMETSAKTACNVEEAFINTAKEIYRKIQQGLFDVHNEANGIKIGPQQSISTSPGPGACQWNSRDVGSDSGCC +>XP_012934205.1_PREDICTED:_CCR4-NOT_transcription_complex_subunit_8_isoform_X1 +MPAALVENSQVICEVWASNLEEEMRKIREIVLSYSYIAMDTEFPGVVVRPIGEFRSSIDYQYQLLRCNVDLLKIIQLGLTFTNEKGEYPSGINTWQFNFKFNLTEDMYSQDSIDLLANSGLQFQKHEEEGIDTLHFAELLMTSGVVLCDNVKWLSFHSGYDFGYMVKLLTDSRLPEEEHDFFHILNLFFPSIYDVKYLMKSCKNLKGGLQEVADQLDLQRIGRQHQAGSDSLLTGMAFFRMKELFFEDSIDDAKYCGRLYGLGTGVAQKQNEDVDSAQEKMSILAIINNMQQ +>XP_004838717.1_PREDICTED:_inhibitor_of_nuclear_factor_kappa-B_kinase_subunit_alpha_isoform_X1 +MERPPGLRPGAGGPWEMRERLGTGGFGNVCLYQHRELDLKIAIKSCRLELSTKNRERWCHEIQIMKKLNHANVVKACDVPEELNFLINDVPLLAMEYCSGGDLRKLLNKPENCCGLKESQILSLLSDIGSGIRYLHENKIIHRDLKPENIVLQDVGGKAMHKIIDLGYAKDVDQGSLCTSFVGTLQYLAPELFENKPYTATVDYWSFGTMVFECIAGYRPFLHHLQPFTWHEKIKKKDPKCIFACEEMTGEVRFSSHLPQPNSLCSLIVEPMENWLQLMLNWDPQQRGGPVDLTLKQPRCFILMDHILNLKIVHILNMTSAKIISFLLPPDESLHSLQSRIEHETGINTGSQELLSETGISLDPRKPASQCVLDGVRGCDSYMVYLFDKSKTVYEGPFASRSLSDCVNYIVQDSKIQLPVVQLRKVWAEAVHYVSGLKEDYSRLFQGQRAAMLSLLRYNANLTKMKNTLISASQQLKAKLEFFQKSIQLDLERYSEQMTYGISSEKMLKAWKEMEEKAIHYAEVGVIGYLEDQIMSLHTEIMELQKSPYGRRQEDLMESLGQRAIDLYKQLKHRPADHSYSDSTEMVKIIVHTVQSQDRVLKELFGHLSKLLGCKQKIIDLLPKVEVALSNIKEADNTVMFMQGKRQKEIWHLLKIACTQSSARSLVGSSLEGAVTPQASAWLPPTLAEREHSLSCVVTPQDGESLAQVIEENLNCLGHLNTIIHEANEEQGNSMMNLDWSWLTE +>XP_004841553.1_PREDICTED:_insulin-like_peptide_INSL5 +MRGPVFTLFLFSVLFAVSEVRGTDTVKLCGLDYVRTVVYICATARWRRQAEGTLPGLQAERRSDLHREASQEILARNLAKLDFSGEELVQEEQVPTEGLRETKKHLAMSRRDLQTLCCTEGCSMTELSGLC +>XP_004873567.1_PREDICTED:_3-hydroxyacyl-CoA_dehydrogenase_type-2 +MAVACRSVKGLVAVITGGASGLGLGTAKRLVEQGAIAVLLDLPNSDGEAQAKKLGKSCVFAPVDVTSEKDVQTALTLAKENFGHVDVAVNCAGIAVANKTYNLKKQQPHSLEDFQRILNVNLLGTFNVIRLVAGEMSRNEPDQGGQRGVIINTASVAAFEGQVGQAAYSASKGGIVSMTLPIARDLAPMGIRVMTIAPGLFDTPLLTSLPEKVRNFLASQVPFPTRIGDPAEYAHLVQTIIENPFLNGEVIRLDGAIRMQP +>XP_004870555.1_PREDICTED:_DNA_repair_protein_complementing_XP-C_cells_isoform_X2 +MARKRAARGRKAGDSSVARRKEKEEADVFEDKKMKLPKKSFHSKVSRGERKRGFTDPGAPADGPVKKKVTKVTVKSEKLKAIKDEPLSDGEDFRDSSRGLKKAQHPKREAAVDKGSDERDEEESEDDWEEVEELSGPAPGDVGESSTSQSILSLKPVEIEIETPEQVKTRERSEKIKMEFETCLRRMMKRFSREVRENTHKVHLLCLLGNGFYRNGVCSQPDLLAVGLSIIPAHFTRVLPQDVDSGYLSSLLKWFIGTFTVNADLSAPDQSSLQTTLERRFAIYSARDEEELVHVFLLILRALQLLTRLVLSLQPLPLKSSMVKGKKPPQERATEDPGDAPGTSSQAAENQPKLQTSKGTREREAFPKGPGKAVTKGKRSKAAAGSAKQREPSSSESEEAGPGKQQPRHSRAQRRALRVSYKEESESDLAASSSDFEPSSGEAHHSSDEDSEPAPRRQRRAPAPQRMKAGSKSDSRTQPGSRRQHPASSRSPGSKRGKKVSQDDEEAGGGRGAGVDQWLEVFCEKEEKWVCVDCAHGLVGQPQACYRYATKPMTYVVGIDSNGWVRDVTQRYDPAWMTATRKCRVDAEWWDETLRPYRSPFMEREKKEDLEFQAKHLDQPLPSAISTYKNHPLYALKRHLLKYEAIYPETAAVLGYCRGEAVYSRDCVHTLHSRDTWLKQARVVRLGEVPYKMVKGYSNRARKARLADPQLRDQNDLGLFGHWQTEEYQPPVAVDGKNQWLCCLRGIQRCAPHCLGE +>XP_004850634.1_PREDICTED:_cannabinoid_receptor_2 +MEGCPETEAANSSMANLDFHPMKHYMVLSGPQRVAVAVLCTLLGLLSTLANAAALYLILSSHRLRQKPSYLFIGSLAGADLLASAIFVCSFVNFHVFSGVDSQVVFLLQICSVTMTFTASVGSLLLTAVDRYLCLRHPQTYRDLLTRGRALAALGVLWVLSALVSYPPLMGWSCCPSLCSELFPLISNDYLLGWLLFIAVLFSGIIYTYSHVLWKAHQHVASLAEHQDKQVPGMTRMRLDVRLAKTLGLLLAVLFVCWFPALALMVYSLAAKLSDKVKKVFAFFSILCLINSMVNPVIYALRSREIRSSARHRLAGWKKCLRGLGMEGKEEAPRSSMKSSITETEADMKITTGLASRDLFYLDS +>XP_012929367.1_PREDICTED:_B_box_and_SPRY_domain-containing_protein_isoform_X2 +MAAEGSGLQRELGPGPKPDALCPEHGQGLGWFCGSERRPVCAACVGPGGRCRGHRVRRAKEHAEELRNKIVDQCERLQLQSAGITKYVAEVLSGKNQRAVSTASAAREVVIQRLSLVRSLCESEEQRLLEQVHGEEERTHQSILTQRAHWAEALQKLNTIRSSLVDMLTHLDDHQLIKEQEIFERTEEAEGILDPQESEKLNFNEKCTWSPLLTQLWATAVLGSLSGTEDVRIDERTVSPFLQLSDDRRTLTFSAKKSKACADGPERFDHWPNALAAASFQTGLHAWMVNVQNSCAYKVGVASGQLPRKGSGSDCRLGHNTFSWVFSRYDQEFRFLHNGQHQPLGLLRSPAQLGVLLDLEARELLFYEPASGTVLYTYHTAFPTPLFPVFAVADQTISIIH +>XP_004841034.1_PREDICTED:_phosphatase_and_actin_regulator_3_isoform_X2 +MRGRGGGRARWPAPLRSLLRAFGARDPAAASRGSAQDEMDRMPPARSEYPVSGIRTPPVRRNSRLATLGRIFKPWKWRKKKNEKLKQTTSALEKKMASRQGREELIKQGLLEMMEQDAESKVCSPGGGLRPTQSEPSTPQPEALTSEDAQPGSPSATAGANQASLDEPLSSDAHSDNAAKLPSVSSGDEADAGSLLSAPDELSQALAGSDSLDSPARALERCVGQLPSAPLLPTPPPKASSKTTRNVTGQAALFQGSGVKSSDPGLRGQLSTPTGSPHLTTIHRPLPPSRVIEELHRALATKHRQDSFQGRESKGSPKKRVDIHLSRTSSMERGEETEEAWSFDGALESKRTAAKESEENKENLIMSSELKDDLLLYQDEEALNDSIISGTLPRRCKKELLAVKLRNRPSKQELEDRNIFPRRTDEERQEIRQQIELKLSKRLSQRPAVEELERRNILKQRNDQTEQEERREIKQRLTRKLNQRPTVDELRDRKILIRFSDYVEVAKAQDYDRRADKPWTRLSAADKAAIRKELNEYKSNEMEVHASSKHLTRFHRP +>XP_004873942.1_PREDICTED:_origin_recognition_complex_subunit_6_isoform_X2 +MSASLQRTARVSPSRAMGSGLIERLAPRLGLAEPSVLRKAEEYLRLSQVKCTALSAHSTETSNAVMCLDLAAACMKCPLDRAYLIKLSGLNKKMYQSCLKSLECLLDVNSNIGIKDLAVQFSCTEAVNMASKILQSYESSLPQTQQVDLDLSRPLFTTAALLSACKILKLKVDKNKMIAMAGVKKAIFDRLCKQLEKTGQHIDRELRDLPSPPRKKKNTVVESLAKEIKKVEEIPHKPQKDKDVTQDYEEWKRKILENAASAQKTTAE +>XP_012921127.1_PREDICTED:_olfactory_receptor_4K15-like +MNETNHSQVTEFVLLGLSSSKELQPFLFLIFSLLYLAILLGNFLIILTVNSDPRLHTPMYFLLANLSFIDVCVASFATPKMIADLLVEHKTISFEACLVQIFCVHLFAGGEMVMLVSMAYDRYVAICKPLHYMTIMNHRVCIILVIIPWCVGFIHTTSQLAFTVNLPFCGPNQVDSFFCDLPLVTKLACTDTYVISLLIVADSGFLSLSSFVLLVVSYTVILFTVRKRSSASMAKARSTLTAHITVVTLFFGPCIFIYVWPFSSYSVDKILAVFYTVFTPILNPVIYTLRNKEMKAAMSKLKSKLLKPGQVSVLIRNVLSLET +>XP_004842010.1_PREDICTED:_type_2_phosphatidylinositol_4,5-bisphosphate_4-phosphatase_isoform_X1 +MAADGVDERSPLLSAAHSGNVTPTAPPYLQESSPRAELPPPYTAIASPDASGIPVINCRVCQSLINLDGKLHQHVVKCTVCNEATPIKNPPTGKKYVRCPCNCLLICKDTSRRIGCPRPNCRRIINLGPVMLISEEQPAQPALPVQPEGTRVVCGHCGNTFLWMELRFNTLAKCPHCKKISSVGSALPRRRCCAYITIGMISIFIGVGLTVGTQDFARQFHATYISWAIAYFLGLICLIRACYWGAIRVSYPEHSFT +>XP_012924063.1_PREDICTED:_rho_guanine_nucleotide_exchange_factor_1_isoform_X1 +MEDIAPRAASGLPRPGLVPVSIIGAEDEDFENELEAHSEEQNSQFQSLEQVKRRPAHLMALLQHVALQFDPAPLLCCLHADMLCSLGPKEAKKTFVDFYHSFLDKTAVLRVPVPPSVAFELDRTRPDLLSEDIQRRFVQEVVQFQQATVGQQLEDFRSKRLMGMTLWEQELSQLEAWVGRDRASYEARERHVAERLLSHLEEMQHTISSDEDKSAAVVTAIGLYMRHLGVRTKSGDKKSGRNFFRKKVMGNRRSDEAPKTKKGLSSILDAARWNRGENQAPDFRHLKSEVDAEKPGPTDRKGGLGVSSRDRNTGTPGLDTPGVSLHPLSGDSPDREPGVDAPLELGDPPPQGPMSLEPLMPPESTEEGAETERKWKRLSGRLGRSESLRVSDRRRPSRGSLGAKGRGGGRSRSDVDMDPSSATAVLGPARRATPEPGDEGEPGRSGLELEPEEPPGWRELVPPDTLLSLPKSQVKRQEVISELLVTEAAHVRMLRVLHDLFYQPIAEGGFFVLEELQNIFPSLDELIEVHSLFLDRLMKRRQESGYLIEEIGDVLLARFDGAEGSWFQKISSRFCSRQSFALEQLKAKQRKDPRFCAFVQEAESRPRCRRLQLKDMIPTEMQRLTKYPLLLQSIGQNTEEPKEREKVEQAAECCRLILHHVNQAVRDTEDLLRLRDYQRRLDLSHLRQSNDPMLSEFKNLDITKKKLVHEGPLTWRVTKDKAVEVHVLLLDDLLLLLQRQDERLLLKSHSRTLTPTPDGKTMLRPVLRLTSAMTREVATDHKAFYVIFTWDQEAQIYELVAQTVSERKNWCALITETAGSLKVPAPASRPKPRPSPSSTRESLLSSSENGNGGREVPPADAQTERILSDLLPFCRPGPEGQLAATALRKVLSLKQLLLPTEEDSGVGPPRDGDGVPGGGPLGPAQTQEIQENLLSLEEAIKQLEELEEEFCRLRPLLAQLGGNPAPQPGCT +>XP_012926212.1_PREDICTED:_hepatocyte_nuclear_factor_3-beta_isoform_X3 +MNAGLGMNGMNTYMSMSAAAMGSGSGNMGAGSMNMSSYVGAGMSPSLAGMSPGAGPMAGMGGTAGAAGVAGMGPHLSPSLSPLGGQAAGAMGGLAPYANMNSMSPMYGQAGLSRARDPKTYRRSYTHAKPPYSYISLITMAIQQSPNKMLTLSEIYQWIMDLFPFYRQNQQRWQNSIRHSLSFNDCFLKVPRSPDKPGKGSFWTLHPDSGNMFENGCYLRRQKRFKCEKQLALKEAAGGGKKGAAGSSATQAPLGEPSGPAPETPAGTESPHSSASPCQEHKRGPLGELKVPPTAGLSPPEPAPSPGQQPSAAAHLLGPAHHPGLPPEAHLKPEHHYAFNHPFSINNLMSSEQQHHHSHHHHQPHKMDLKAYEQVMHYPGYGSPMPGSLAMGPVTNKAGLDASPLAADTSYYQGVYSRPIMNSS +>XP_012925804.1_PREDICTED:_voltage-dependent_calcium_channel_subunit_alpha-2/delta-1_isoform_X3 +METMGAGRLLAVVLALLQGALIRPSAPEPFPSAVTIKSWVDRMQEDLVTLAKTASGVTQLVDIYEKYQDLYTVEPNNARQLVEIAARDIEKLLSNRSKALERLALKAEKVQAAHQWREDFASNEVVYYNAKDDLDSEKNDSEPGSQRIKPVFVEDANFGRQISYQHAAVHIPTDIYEGSTIVLNELNWTSALDEVFKKNREEDPTLLWQVFGSATGLARYYPASPWVDSRTPNKIDLYDVRRRPWYIQGAASPKDMLILVDVSGSVSGLTLKLIRTSVSEMLETLSDDDFVNVASFNSNAQDVSCFQHLVQANVRNKKVLKDAVNNITAKGITDYKKGFSFAFEQLLNYNVSRANCNKIIMLFTDGGEERAQEIFTKYNKDKKVRVFTFSVGQHNYDRGPIQWMACENKGYYYEIPSIGAIRINTQEYLDVLGRPMVLAGEKARKVQWTNVYLDALELGLVITGTLPVFNRTGQSENETNLKNQLILGVMGVDVSLEDIKRLTPRFTLCPNGYYFAIDPNGYVLLHPNLQPKNPKSQEPVTLDFLDAELENDIKVEIRNKMIDGESGEKTFRTLVKSQDERYIDKGNRTYTWTPVNGTDYSLALVLPTYSFYYIKAKIEETITQARSKKGKMKDSETLKPDNFEESGYTFIAPRDYCNDLKPSDNNTEFLLNFNEFIDRKTPNNPSCNTDLINRVLLDAGFTNELVQNYWSKQKNIKGVRARFVVTDGGITRVYPKEAGENWQENPETYEDSFYKRSLDNDNYVFTAPYFNKSGPGAYESGIMVSKAVEIYIQGKFLKPAVVGIKIDVNSWIENFTKASIRDPCAGPICDCKRNSDVMDCVILDDGGFLLMANHDDYTNQIGRFFGEIDPSLMRHLVNIPVYAFNKSYDYQSVCEPGAAPKQGAGHRSAHVPSIADVLQIGWWATAAAWSILQQFLLSLTFPGLLEAVDVEEEDFTASLSKQSCITEQTQYFFYNDSKSFSGILDCGNCSRIFHVEKLMNTNLMFIMVESKGSCPCDTRLLIQAEQTSDGPNPCDMVKQPRYRKGPDVCFDNSEMEDYSDCGGVSGLRSSLWSVLGLQFLLLWLVSGSRHYLL +>XP_004840470.1_PREDICTED:_archaemetzincin-1 +MLPCRPAQEFSFGPRMLRDALVSSDTGLQQCYTGAFSLAERLFLAEAYNPHRTLFHPLLIYSAFDWLLSRPEAPEDFASFHAALPHRTQSLPRKHIYLQPIDLSEAPVGFPLLDYLRSCAEAFFLGLRVKCLPSVAAESISCSSRPRRDSDGLQLNTDGILSFLKNNKPDDALCVLGLTLSDLYPCEAWSFTFSTFLPGHKVGICSFARFVGELPQAGSSAPYPAPLEAAVDGSERLTQDSGQRLCFSALGVVQCCKVTCHELCHLLGLGNCRWLRCLMQGALSLEEVLRWPLDLCPICLRKLQHVLGFQLLDRYKRLHTWTQAVVGTWPSLEAGEPSVSETTLPVSADSGMCCESDSEPGTSLSEPGTPDAWSRTFPEGPEDELSSLAAAEVLPRLGGPVEAMEEHGRWLATCIEALEREVAEEELAQVDRAVDALEPWEMFTGRLPAIRQDRPCSRDSAGLRKVLGDKLSSLRRRLGMRRLSKVDSSPCHWDGQEK +>XP_004858457.1_PREDICTED:_E3_ubiquitin-protein_ligase_NEDD4-like_isoform_X1 +MATGLGEQVYGLSEDEGESRILRVKVVSGIDLAKKDIFGASDPYVKLSLYVADENRELALVQTKTIKKTLNPKWNEEFYFRVNPSNHRLLFEVFDENRLTRDDFLGQVDVPLSHLPTEDPTMERPYTFKDFLLRPRSHKSRVKGFLRLKMAYMPKNGGQDEESSEQRDDMEHGWEVVDSSDSASQHQEELPPPPLPPGWEEKVDNLGRTYYVNHNNRTTQWHRPSLMDVSSESDNNIRQINQEAAHRRFRSRRHISEDLEPEASEGGEGPEPWETISEEVNMTGDSLGLALPPPPASPVSRTSPQELSEELSRRLQITPDSNGEQFTSLIQREPSSRLRSCSVTDTVAEQGHLPPPSAPTGRARSSTVTGGEEPTPSVAYVHTTPGLPSGWEERKDAKGRTYYVNHNNRTTTWTRPIMQLAEDGASGSATNSNNHLIEPQIRRPRSLSSPTVTLSAPLEGAKDSPIRRAVKDTLSNPQSPQPSPYNSPKPQHKVTQSFLPPGWEMRIAPNGRPFFIDHNTKTTTWEDPRLKFPVHMRSKASLNPNDLGPLPPGWEERIHLDGRTFYIDHNSKITQWEDPRLQNPAITGPAVPYSREFKQKYDYFRKKLKKPADIPNRFEMKLHRNNIFEESYRRIMSVKRPDVLKARLWIEFESEKGLDYGGVAREWFFLLSKEMFNPYYGLFEYSATDNYTLQINPNSGLCNEDHLSYFTFIGRVAGLAVFHGKLLDGFFIRPFYKMMLGKQITLNDMESVDSEYYNSLKWILENDPTELDLMFCIDEENFGQTYQVDLKPNGSEIMVTNENKREYIDLVIQWRFVNRVQKQMNAFLEGFTELLPIDLIKIFDENELELLMCGLGDVDVNDWRQHSIYKNGYCPNHPVIQWFWKAVLLMDAEKRIRLLQFVTGTSRVPMNGFAELYGSNGPQLFTIEQWGSPEKLPRAHTCFNRLDLPPYETFEDLREKLLMAVENAQGFEGVD +>XP_012933589.1_PREDICTED:_beta-1,3-N-acetylglucosaminyltransferase_radical_fringe_isoform_X4 +MSCARGALCRACLALAAALAALLLLPLPRPPAPARLPAAVVVASPSLRPDDDIFIAVKTTRKNHGPRLGLLLRTWISRARPQTFIFTDGDDPELQRQAGSHIINTNCSAVRTRQALCCKMSVEYDKFIESGRKTLPAHRWFCHVDDDNYVNPTTLLHLLSTFSPNQDVYLGRPSLDHPIEATERVQGGGTATTVKFWFATGGAGFCLSRGLALKMSPWARQLHEHSGEGEASRRLHGGLHRGRAAGGPAAAQPPLPLPPGEPAEAADGRCAAAGHSKLWGS +>XP_004855755.1_PREDICTED:_tropomyosin_alpha-1_chain_isoform_X12 +MAGSSSLEAVRRKIRSLQEQADAAEERAGSLQRELDQERKLRETAEADVASLNRRIQLVEEELDRAQERLATALQKLEEAEKAADESERGMKVIESRAQKDEEKMEIQEIQLKEAKHIAEDADRKYEEVARKLVIIESDLERAEERAELSEGKCAELEEELKTVTNNLKSLEAQAEKYSQKEDKYEEEIKVLSDKLKEAETRAEFAERSVTKLEKSIDDLEDELYAQKLKYKAISEELDHALNDMTSM +>XP_004844462.1_PREDICTED:_type_I_inositol_3,4-bisphosphate_4-phosphatase_isoform_X3 +MTAREHSPRHGARARAMQRASTIDVAADMLGLSLAGNIQDPDEPILEFSLACSELHTPSLDRKPNSFVAVSVTTPPQAFWTKHAQTEIIEGTNNPIFLSSIAFFQDSLINQMTQIKLSVYDVKDRSQGTMYLLGSGTFIVKDLLQDRHHRLHLTLRSAESDRVGNITVIGWQMEDKSDQRPPVTRSLDPVNGRMVLPVDESLTEALGIRSKYASLRKDTLLKSVFGGAICRMYRFPTTDGNHLRILEQMAESVLSLHVPRQFVKLLLEEDAARVCELEELGELSPCWESLRRQIVTQYQTVILTYQENLTDLHQYKGPSFKASSLKADKKLEFVPTNLHIQRMRVQDDGGSDQNYDIVTIGAPAAHCQGFKSGGLRKKLHKFEETKKHSFEESCTSSSCQSIIYIPQDIVRAKEIIAQINTLKTQVSYYAERLSRAAKDRSATGLERTLAILADKTRQLVTVCDCKLLANSIHGLNAARPDYIASKASPTSTEEEQVMLRNDQDTLMARWTGRNSRSSLQVDWHEEEWEKVWLNVDKSLECIIQRVDKLLQKERLHGESCEDVFPYAGSCTSKKDCSPPPEAPSPGEWSEALYPLLTTLTDCVAMMSDKAKKAMVFLLMQDSAPTIASYLSLQYRRDVVFCQTLTALICGFIIKLRNCLHDDGFLRQLYTIGLLAQFESLLSTYGEELAMLEDMSLGIMDLRNVTFKVTQATSNASTDMLPVITGNRDGFNVRIPLPGPLFDALPREIQSGMLLRVQPVLFNVGINEQQTLAERFGDTSLQEVINVESLVRLNSYFEQFKEVLPEDCLPRSRSQTCLPELLRFLGQNVHARKNKNVDILWQAAEICRRLNGVRFTSCKSAKDRTAMSVTLEQCLILQHEHGMAPQVFTQALECMRSIGTREVVTQKNLSGLVPIRDLRLDPSLLCSIPLLALSPNLLIVWLFLSIAYLVTKLRCK +>XP_004843156.1_PREDICTED:_carbonic_anhydrase_7_isoform_X3 +MTGWGYGQDDGPSNWHKLYPIAQGDRQSPINIISSQAVYSPSLQPLELSYEACTSLSITNNGHSVQVDFNDSDDRTVVTGGPLEGPYRLKQFHFHWGKKRDVGSEHTVDGKSFPSELHLVHWNAKKYSTFGEAASAPDGLAVVGVFLETGDEHPSMNRLTDALYMVRFKMEKFRSLLFTSEDDERIHMVNNFRPPQPLKGRVVKASFRA +>XP_012926753.1_PREDICTED:_synaptojanin-1_isoform_X10 +MLHYLVLVTGCMSVGKIQESEVFRVTSTEFISLRVDASDEDRISEVRKVLNSGNFYFAWSASGASLDLSLNAHRSMQEHTTDNRFFWNQSLHLHFKHYGVNCDDWLLRLMCGGVEIRTIYAAHKQAKACLISRLSCERAGTRFNVRGTNDDGHVANFVETEQVVYLDDSVSSFIQIRGSVPLFWEQPGLQVGSHRVRMSRGFEANAPAFDRHFRTLKNLYGKQIIVNLLGSKEGEHMLSKAFQSHLKASEHAADIHMVNFDYHQMVKGGKAEKLHSVLKPQVQKFLDYGFFYFDGSEVQRCQSGTVRTNCLDCLDRTNSVQAFLGLEMLAKQLEALTLAEKPQLVTRFQEVFRSMWSVNGDSISKIYAGTGALEGKAKAGKLKDGARSVTRTIQNNFFDSSKQEAIDVLLLGNTLNSDLADKARALLTTGSLRVSEQTLQSASSKVLKSMCENFYKYSKPKKIRVCVGTWNVNGGKQFRSIAFKNQTLTDWLLDAPKLAGIQEFQDKRSKPTDIFAIGFEEMVELNAGNIVNASTTNQKLWAVELQKTVSRDNKYVLLASEQLVGVCLFVFIRPQHAPFIRDVAVDTVKTGMGGATGNKGAVAIRMLFHTTSLCFVCSHFAAGQSQVKERNEDFIEIARKLSFPMGRLLFSHDYVFWCGDFNYRIDLPNEEVKELIRQQNWDSLIAGDQLINQKNAGQIFRGFLEGKVTFAPTYKYDLFSDDYDTSEKCRTPAWTDRVLWRRRKWPFDRSAEDLDLLNASFQDESKILYTWTPGTLLHYGRAELKTSDHRPVVALIDIDIFEVEAEERQNIYKEVITVQGPPDGTVLVSIKSSLQEDNFFNDALIDELLQQFANFGEVTLIRFVEDKMWVTFLEGSSALSVLSLNGKELLNRTVTITLKSPDWIKNLEEEMSLEKISVTLPSSTSSTLLGEDAEVAADFDMEGDVDDYSAEVEELLPQHLQPSSSSGLGTSPSSSPRTSPCQSPTIAEAPVPCLPIRPSRAPSRTPGPPSSQSSPVDTQPAAQPQQKESSQTLEPKRPPPPRPGAPPTRPTPPQRPPPPSGARSPAPARKEFGGIGAPPSPGVARREMEAPKSPGTTRKENIGCNVFIPGRNQPSSQAGFGGPGPAGPSTARPTIPPRAGVISAPQSHARASAGRLTPESQSKPPEASKGSTLLPEPLKPQAAFPVQPSLPSPAPKFQEPLVPTAAPMPQLGPQPTLETPPQPPPRSRSSQGLPSESSPQPQVKTNGVSSVKQESLLKSDPFEDLSFNLLAVSKAQLSVQTSPVLTPDPERLIQLPPATQSTVNTWSSVSCMPTMPPIPARSQENTRSSPNPFITSLTSTNPFTDRTAVPGNPFRAQSQESEATSWLSKEEPITNSPVPSLMPLRQNSSKPSSSLDCFKDSFDLQGQSTVKTSNPKGWVTFEEEEDFGVKGKSKSFCPNALGNQPNAFDDDWNKGADVSLCVLPSRRPPPPPVPLLPPSASPATDPFTTLASKASPTQDFTER +>XP_012920744.1_PREDICTED:_leucine-rich_repeat-containing_protein_16B_isoform_X6 +MAKASVELTRELQDSIRRCLSQGAVFQQHRVKLETKPKKFEDRVLALTSWRLHLFPLKVPAKVESSFNVLEIRAFNTLGQNQILVETERGMVSLRLPSAESVDQVTRHVSSALSKVCPGPGCLIRRANADTPEGPRDTSPNSETSTSTTHSVCGGFSETYAALCDYNGLHCREEVQWDVDTIYHAEDNREFNLLDFSHLESRDLALMVAALAYNQWFTKLYCKDLRLGSEVLEQVLHTLSKSGSLEELVLDNAGLKTDFVQKLAGVFGENGSCVLHALTLSHNPIEDKGFLSLSQQLLCFPTGLTKLCLAKTAISPRGLQALGQTFGANPAFASSLRYLDLSKNPGLLATDEANALYSFLAQPNALIHLDLSGTDCTVDLLLGALLHGCCSHLTYLNLARNSCTHRKGREAPPAFKQFFSSTYTLSHINLSATRLPLEALRALLQGLSLNSHLSDLHLDLSSCELRSAGAQALQEQLGSVTCVGSLDLSDNGFDSDLLTLVPALGKNKSLKHLFLGKNFNVKAKTLEEILHKLVQLIQEEDCSLQSLSVADSRLKLRTSILINALGSNTCLAKVDLSGNGMEDIGAKMLSKALQINSSLRTILWDRNNTSALGFLDIARALESNHTLRFMSFPVSDISQAYRSAPERTEDVWQKIQWCLVRNNHSQTCPQEQAFRLQQGLVTSSAEQMLQRLCGRVQEEVRALRLCPLEPVQDELLYARDLIKDAKNSRALFPSLYELGHVLANDGPVRQRLESVASEVSKAVDKELQVILESMVSLTQELCPVAMRVAEGHNKMLSNVAERVTVPRNFIRGALLEQAGQDIQNKLDEVKLSVVTYLTNSIVDEILQELYHSHKSLARHLTQLRTLSDPQGGPGQGQDLSSRGRGRNHDHEETTDDELGTNIDTMAIKKQKRCRKIRPVSAFISGSPQDMESQLGSLGIPPGWFSGLGGSQPTASGSWEGLSELPTHGYKLRHQTQGRPRPPRTTPPGPGRPSQVPVPGTRQENGMASCLDEGLEDFFSRKVMDESSSYPRTLRTVRPGLSEPPLPPLQKKRRRGLFHFRRPRSFKGDRGPGSPTTGLLLPPPPPPPPTQESPPSPDPPSLGNNNSSPCWTPEEESSLLPGLAGGRGPSFRRKMGTEGSEAGEGVTTPRTAQQPTVHGVALPGLGRPKGWSFDGKREGTGSDLEDSTQAWQKRRSSDDAGPGAWKPPPPPQSSKPSFSAMRRAEATWHIAEESGPSHSCQSPSPASQDGEEEEGAFFPERTVLARNAKLQDPPLAPRLPKPVAVPRGRRAPQVQGGREEAETGGTAPGISKPRLRLGSQQDQEEPEVQGPPDPGRRTAPLKPKRTRRAQSCDKLEPDRRRPPDPAAGSSEPGTD +>XP_004838809.1_PREDICTED:_phospholysine_phosphohistidine_inorganic_pyrophosphate_phosphatase_isoform_X1 +MAVWGERLAGVRGVLLDISGVLFDSCEGGGVPIPGSVEAVARLKQSQLKVRFCTNESQKSRGKLVGLLQRLGFDISEGEVTSPAPAACQILKERGLRPHLLVHDDILSEFDKIDTSNPNCVLIADAGDAFSYKNMNKAFQVLMELENPVLISLGKGRYYKETLGLMLDVGAYMKALEYACGVEAEVVGKPSPEFFKNALQVLGVEAHQAIMIGDDIVGDVGGAQRCGMRALQVRTGKFRPSDEHHPEVKADGYVDNLAEAVDLLLQQVDK +>XP_012933189.1_PREDICTED:_calcium-binding_and_coiled-coil_domain-containing_protein_2_isoform_X2 +MKRKLKRASTSCFLSPSLGLEESQTSSLIRALDGPAMEKAREEPPSSTVLLDHASFSQVIFNNVEKFYLPGGDVTCFYIFTQQFTPRRKDWIGIFKVGWKTTREYYTFMWVALPRDPSTKQQEVQFRAYYLPKDDEYYQFCYVDQDGMVRGASVPFQFRPESEEDILVVTTKVKVEETEQHNKELCQENQELQALCAHLEEQNSAAQAELQRKQEELETLQSVNKKLEQESEEQKAHWDSERLQLKEQDQQLRSENDQLGTRVAELQSQLLSQEKEMEELVQGDQEKTEKLQHLKNGNDQLCLSLTEQREQQKKLEEALEEMRLRETAALKTQAALMDENLDLSRRLDDNKVLCDSLQREKELLERENDLLRKESCRLLSYQAPDFDSLPLQVPAWDQEGASQNPGLVFGNPYSGTQESSTPGPVRCTVPLSTSQVPKTFHPFSVCGLQGEDSGWKPMIRLGLTTSVSIGKCPVCSGVSPDGVCEHLEEQQRAQGHCMTCPVCDQTFPVTEKQIFEDHVFCHYLSAPLA +>XP_012922645.1_PREDICTED:_LOW_QUALITY_PROTEIN:_ret_finger_protein-like_4B +MPVTLATDVFEIVACECPLCECTVLLSSQPTPSKANLTRSHQGQGAGLQFHSRTVDGSVRPRFQSVLAAGAAVWGAFGALGQKAVSSILVRGSTPGPFDSFFTVFICNLSRSVVPSCYSLLPVSAAHIPFLTFGTVVASWQAQLTCPICLEVFSRVISLACSHIFLSFKCIENRIIEXDYTVIYLLCXGEVKLPVMEEWQNRSLDATSVTSLPMLSSNLKSVHVWIFSMKARAIHASXFPEIIPASPSFHCVGIFLGLDREEIKDFDVKNATLIYKQFFHSSV diff --git a/files/final_project/example/readme.md b/files/final_project/example/readme.md new file mode 100644 index 00000000..b650ba75 --- /dev/null +++ b/files/final_project/example/readme.md @@ -0,0 +1 @@ +thre protein files for the example of Episode 10 - optional project diff --git a/index.md b/index.md new file mode 100644 index 00000000..c75e9e2e --- /dev/null +++ b/index.md @@ -0,0 +1,30 @@ +--- +site: sandpaper::sandpaper_site +--- + +La terminal de Unix ha existido por más tiempo que la mayoría de sus usuarios. +Ha sobrevivido tanto tiempo porque es una herramienta poderosa +que permite a las personas hacer cosas complejas con sólo unas pocas teclas. +Lo más importante es que ayuda a combinar programas existentes de nuevas maneras +y automatizar tareas repetitivas, en vez de estar escribiendo las mismas cosas una y otra vez. +El uso del terminal o **shell** es fundamental para usar muchas otras herramientas poderosas +y recursos informáticos (incluidos los supercomputadores o "computación de alto rendimiento"). +Esta lección te guiará en el camino hacia el uso eficaz de estos recursos. + +:::::::::::::::::::::::::::::::::::::::::: prereq + +## Prerequisitos + +Esta lección te guía a través de los principios básicos de los sistemas de archivos y +la terminal **shell**. Si has guardado archivos en una computadora y reconoces que +las palabras "archivo", "directorio" o "carpeta" (estas dos últimas sinónimos para referirse al mismo concepto), entonces +estás lista para seguir esta lección. + +Por otro lado, si ya tienes experiencia manipulando archivos y directorios, +buscando archivos con `grep` y` find`, y escribiendo bucles simples +y scripts, probablemente no aprenderás mucho de esta lección. + + +:::::::::::::::::::::::::::::::::::::::::::::::::: + + diff --git a/instructor-notes.md b/instructor-notes.md new file mode 100644 index 00000000..d9a67aaa --- /dev/null +++ b/instructor-notes.md @@ -0,0 +1,5 @@ +--- +title: 'Instructor Notes' +--- + +This is a placeholder file. Please add content here. diff --git a/learner-profiles.md b/learner-profiles.md new file mode 100644 index 00000000..434e335a --- /dev/null +++ b/learner-profiles.md @@ -0,0 +1,5 @@ +--- +title: FIXME +--- + +This is a placeholder file. Please add content here. diff --git a/md5sum.txt b/md5sum.txt new file mode 100644 index 00000000..d92e6a72 --- /dev/null +++ b/md5sum.txt @@ -0,0 +1,17 @@ +"file" "checksum" "built" "date" +"CODE_OF_CONDUCT.md" "c93c83c630db2fe2462240bf72552548" "site/built/CODE_OF_CONDUCT.md" "2023-04-24" +"LICENSE.md" "b24ebbb41b14ca25cf6b8216dda83e5f" "site/built/LICENSE.md" "2023-04-24" +"config.yaml" "86848c57a97173289782e9595f3ca05b" "site/built/config.yaml" "2023-04-24" +"index.md" "1c4c968ccda0443f3948506bf021c7b0" "site/built/index.md" "2023-04-24" +"episodes/01-intro.md" "b1b661830debed4947032e58dde6578e" "site/built/01-intro.md" "2023-04-24" +"episodes/02-filedir.md" "881476d53c3479b4c7c55f78dafd3f0e" "site/built/02-filedir.md" "2023-04-24" +"episodes/03-create.md" "c3f945cc0dae6b515bc4ff2877904488" "site/built/03-create.md" "2023-04-24" +"episodes/04-pipefilter.md" "9da645717bb81be686c48adf27c9c9d5" "site/built/04-pipefilter.md" "2023-04-24" +"episodes/05-loop.md" "56d9d28a669b40e1d99a003b14f9b2b1" "site/built/05-loop.md" "2023-04-24" +"episodes/06-script.md" "12d5923b85e1ee265c10b9efc1fcb230" "site/built/06-script.md" "2023-04-24" +"episodes/07-find.md" "d6c8c811d8f475cd92dc32341a9da5a6" "site/built/07-find.md" "2023-04-24" +"instructors/instructor-notes.md" "cae72b6712578d74a49fea7513099f8c" "site/built/instructor-notes.md" "2023-04-24" +"learners/discuss.md" "062c3ab671ff51ccfdbcbe501f3cee07" "site/built/discuss.md" "2023-04-24" +"learners/reference.md" "f57f26bf1b2e09ac9cc86f70f573e95e" "site/built/reference.md" "2023-04-24" +"learners/setup.md" "e9c5683c5e13cce3a1db7edbb8bec73c" "site/built/setup.md" "2023-04-24" +"profiles/learner-profiles.md" "60b93493cf1da06dfd63255d73854461" "site/built/learner-profiles.md" "2023-04-24" diff --git a/reference.md b/reference.md new file mode 100644 index 00000000..a1975d6f --- /dev/null +++ b/reference.md @@ -0,0 +1,151 @@ +--- +title: 'FIXME' +--- + +## Glossary + +## Resumen de Comandos Básicos + +| Acción | Archivos | Directorios o Carpetas | +| ------------- | -------- | ---------------------- | +| Inspeccionar | ls | ls | +| Ver contenido | cat | ls | +| Navega hacia | | cd | +| Mover | mv | mv | +| Copiar | cp | cp -r | +| Crear | nano | mkdir | +| Eliminar | rm | rmdir, rm -r | + +## Jerarquía del sistema de archivos + +La siguiente es una descripción general de un sistema de archivos Unix estándar. +La jerarquía exacta depende de la plataforma, +por lo que es posible que no veas exactamente los mismos archivos / directorios en tu computadora: + +![](fig/standard-filesystem-hierarchy.svg){alt='Jerarquía del sistema de archivos de Linux'} + +## Glosario + +[argumento]{#argumento} +: Un valor dado a una función o programa cuando se ejecuta. El término a menudo se usa indistintamente (y de manera inconsistente) con [parámetro](#parámetro). + +[bandera o **flag**]{#bandera-o-flag} +: Una forma concisa de especificar una opción o configuración a un programa de línea de comandos. Por convención, las aplicaciones Unix usan un guión seguido de una sola letra, como `-v`, o dos guiones seguidos de una palabra, como +`--verbose`, mientras que las aplicaciones de DOS usan una barra inclinada, como `/ V`. Dependiendo de la aplicación, un indicador puede ir seguido de un único argumento, como en `-o / tmp / output.txt`. + +[comillas]{#comillas} +: (en la terminal): +Se utilizan comillas de varios tipos para evitar que el intérprete interprete caracteres especiales. Por ejemplo, para pasar la secuencia de caracteres `*.txt` a un programa, generalmente es necesario escribirlo como `'* .txt'` (con comillas simples) para que la terminal no intente expandir el comodín `*`. + +[comentario]{#comentario} +: Un comentario en un programa pretende ayudar a los lectores a entender lo que está sucediendo, pero es ignorado por la computadora. Los comentarios en Python, R y la terminal de Unix comienzan con un caracter `#` y se ejecutan hasta el final de la línea; los comentarios en SQL comienzan con `--`, y otros idiomas tienen otras convenciones. + +[comodín o caracter especial]{#comodín-o-caracter-especial} +: Un caracter utilizado para coincidir con patrones. En la terminal de Unix, el comodín `*` coincide con cero o más caracteres, para que `*.txt` coincida con todos los archivos cuyos nombres terminen en `.txt`. + +[cuerpo de bucle]{#cuerpo-de-bucle} +: El conjunto de instrucciones o comandos que se repiten dentro de un [for bucle](#for-bucle) o [while bucle](#while-bucle). + +[directorio de inicio]{#directorio-de-inicio} +: El directorio predeterminado asociado con una cuenta en un sistema informático. Por convención, todos los archivos de un usuario se almacenan en o debajo de su directorio de inicio. + +[directorio de padres]{#directorio-de-padres} +: El directorio que "contiene" el que está en cuestión. Cada directorio en un sistema de archivos, excepto el [directorio raíz](#directorio-raíz), tiene un padre. Por lo general, se hace referencia al padre de un directorio usando la notación abreviada `..` (pronunciado "dot dot"). + +[directorio de trabajo actual]{#directorio-de-trabajo-actual} +: El directorio del que se calculan [paths relativos](#path-relativo); equivalentemente, el lugar donde se buscan los archivos a los que se hace referencia solo por nombre. Cada [proceso](#proceso) tiene un directorio de trabajo actual. El directorio de trabajo actual generalmente se refiere a la notación abreviada `.` (pronunciado "punto"). + +[directorio raíz]{#directorio-raíz} +: El directorio más alto en un [sistema de archivos](#sistema-de-archivos). Su nombre es "/" en Unix (incluidos Linux y Mac OS X) y "\\" en Microsoft Windows. + +[entrada estándar]{#entrada-estándar} +: Flujo de entrada predeterminado de un proceso. En aplicaciones interactivas de línea de comandos, generalmente está conectado al teclado; en un [pipe](#pipe), recibe datos de [salida estándar](#salida-estándar) del proceso anterior. + +[expresión regular]{#expresión-regular} +: Un patrón que especifica un conjunto de secuencia de caracteres. Los RE se usan con mayor frecuencia para encontrar secuencias de caracteres. + +[extensión de archivo]{#extensión-de-archivo} +: La parte del nombre de un archivo que aparece después del "." final. Por convención, esto identifica el tipo de archivo: +    `.txt` significa "archivo de texto", `.png` significa "archivo de red portátil de gráficos", y así. Estas convenciones no son aplicadas por la mayoría de los sistemas operativos: +    es perfectamente posible (¡pero confuso!) nombrar un archivo de sonido MP3 `homepage.html`. Dado que muchas aplicaciones usan extensiones de nombre de archivo para identificar el [tipo MIME](#tipo-mime) del archivo, los archivos de desincronización pueden hacer que esas aplicaciones fallen. + +[filtrar]{#filtrar} +: Un programa que transforma una secuencia de datos. Muchas herramientas de línea de comandos de Unix están escritas como filtros: leen datos de [entrada estándar](#entrada-estándar), +    procesarlo y escribir el resultado en [salida estándar](#salida-estándar-1). + +[for bucle]{#for-bucle} +: Un bucle que se ejecuta una vez para cada valor en algún tipo de conjunto, lista o rango. Ver también: [while bucle](#while-bucle). + +[guión de terminal]{#guión-de-terminal} +: Un conjunto de comandos [terminal](#terminal) almacenados en un archivo para su reutilización. Un script de terminal es un programa ejecutado por la terminal; el nombre "script" se usa por razones históricas. + +[interfaz de línea de comando]{#interfaz-de-línea-de-comando} +: Una interfaz de usuario basada en comandos de tipeo, generalmente en un [REPL](#read-evaluate-print-loop). Ver también: [interfaz gráfica de usuario](#interfaz-gráfica-de-usuario). + +[interfaz gráfica del usuario]{#interfaz-gráfica-del-usuario} +: Una interfaz de usuario basada en la selección de elementos y acciones desde una pantalla gráfica, usualmente controlado usando un mouse. Ver también: [interfaz de línea de comandos](#interfaz-de-línea-de-comandos). + +[lazo]{#lazo} +: Un conjunto de instrucciones que se ejecutarán varias veces. Consiste en un [cuerpo de bucle](#cuerpo-de-bucle) y (por lo general) un condición para salir del bucle. Ver también [for bucle](#for-bucle) y [while bucle](#while-bucle). + +[ortogonal]{#ortogonal} +: Tener significados o comportamientos que son independientes el uno del otro. Si un conjunto de conceptos o herramientas son ortogonales, se pueden combinar de cualquier manera. + +[parámetro]{#parámetro} +: Una variable nombrada en la declaración de una función que se usa para mantener un valor pasado a la llamada. El término a menudo se usa indistintamente (y de manera inconsistente) con [argumento](#argumento). + +[path]{#path} +: Una descripción que especifica la ubicación de un archivo o directorio dentro de un [sistema de archivos](#sistema-de-archivos). Ver también: [path absoluto](#path-absoluto), [path relativo](#path-relativo). + +[path absoluto]{#path-absoluto} +: Un [path](#path) que hace referencia a una ubicación particular en un sistema de archivos. Los paths absolutos generalmente se escriben con respecto al sistema de archivos [directorio raíz](#directorio-raíz-1), y comienzan con "/" (en Unix) o "\\" (en Microsoft Windows). Ver también: [path relativo](#path-relativo). + +[path relativo]{#path-relativo} +: Un [path](#path) que especifica la ubicación de un archivo o directorio con respecto al [directorio de trabajo actual](#directorio-de-trabajo-actual). Cualquier ruta que no comience con un caracter separador ("/" o "\\") es una ruta relativa. Ver también: [path absoluto](#path-absoluto). + +[pipe]{#pipe} +: Una conexión desde la salida de un programa a la entrada de otro. Cuando dos o más programas están conectados de esta manera, se denominan "canalización" o **piping**. + +[proceso]{#proceso} +: Una instancia en ejecución de un programa, que contiene código, valores de variables, archivos abiertos y conexiones de red, y así sucesivamente. Los procesos son los "actores" que maneja el [sistema operativo](#sistema-operativo); generalmente ejecuta cada proceso durante unos pocos milisegundos a la vez para dar la impresión de que están ejecutándose simultáneamente. + +[prompt]{#prompt} +: Un caracter o caracteres se muestran con [REPL](#read-evaluate-print-loop) para mostrar que está esperando su próximo comando. + +[read-evaluate-print-loop]{#read-evaluate-print-loop} +: (REPL): Una [interfaz de línea de comandos](#interfaz-de-línea-de-comandos-1) que lee un comando del usuario, lo ejecuta, imprime el resultado y espera otro comando. + +[redirigir]{#redirigir} +: Para enviar la salida de un comando a un archivo en lugar de a la pantalla u otro comando, o de manera equivalente, para leer la entrada de un comando desde un archivo. + +[sistema de archivos]{#sistema-de-archivos} +: Un conjunto de archivos, directorios y dispositivos de entrada y salida (E/S) (como teclados y pantallas). Un sistema de archivos puede extenderse a través de muchos dispositivos físicos, o muchos sistemas de archivos pueden almacenarse en un solo dispositivo físico; el [sistema operativo](#sistema-operativo) administra el acceso. + +[salida estándar]{#salida-estándar} +: Flujo de salida predeterminado de un proceso. En aplicaciones interactivas de línea de comandos, los datos enviados a la salida estándar se muestran en la pantalla; con un [pipe](#pipe), se pasa a la [entrada estándar](#entrada-estándar-1) del siguiente proceso. + +[sistema operativo]{#sistema-operativo} +: Software que gestiona las interacciones entre usuarios y los [procesos](#proceso) de hardware y software. Por ejemplo, Linux, OS X y Windows. + +[subdirectorio]{#subdirectorio} +: Un directorio contenido en otro directorio. + +[tabulación completa]{#tabulación-completa} +: Una función proporcionada por muchos sistemas interactivos en los que presionar la tecla Tab activa la finalización automática de la palabra o comando actual. + +[terminal]{#terminal} +: Una [interfaz de línea de comando] como Bash (Bourne-Again Shell) o la terminal de Microsoft Windows DOS que permite a un usuario interactuar con el [sistema operativo](#sistema-operativo). + +[terminal de comandos o terminal de shell]{#terminal-de-comandos-o-terminal-de-shell} +: Ver [terminal](#terminal) + +[tipo MIME]{#tipo-mime} +: Los tipos MIME (extensiones multipropósito de correo de Internet) describen diferentes tipos de archivos para el intercambio en Internet, por ejemplo, imágenes, audio y documentos. + +[variable]{#variable} +: Un nombre en un programa que está asociado con un valor o una colección de valores. + +[while bucle]{#while-bucle} +: Un bucle que se ejecuta siempre que alguna condición sea verdadera. Ver también: [for bucle](#for-bucle). + + diff --git a/setup.md b/setup.md new file mode 100644 index 00000000..54428215 --- /dev/null +++ b/setup.md @@ -0,0 +1,17 @@ +--- +title: Preparación +--- + +Para esta lección necesitas descargar unos archivos: + +1. Descarga [shell-novice-data.zip](data/shell-novice-data.zip) y luego mueve el archivo a tu **Desktop**. +2. Unzip/extraer/descomprimir el archivo (pregunta a tu instructor si necesitas ayuda). Después deberías tener un nuevo directorio en tu **Desktop** con el nombre **data-shell**. +3. Abre la terminal y escribe **cd**: + +```bash +$ cd +``` + +En la lección, aprenderás como acceder a los datos de este directorio. + +