Files
tldr/pages.zh/linux/compseq.md

36 lines
1.7 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# compseq
> 计算序列中唯一单词的组成。
> 更多信息:<https://www.bioinformatics.nl/cgi-bin/emboss/help/compseq/>.
- 计算FASTA文件中单词的观察频率提供交互提示的参数值
`compseq {{path/to/file.fasta}}`
- 从FASTA文件中计算氨基酸对的观察频率并将输出保存到文本文件中
`compseq {{path/to/input_protein.fasta}} -word 2 {{path/to/output_file.comp}}`
- 从FASTA文件中计算六聚核苷酸的观察频率并将输出保存到文本文件中同时忽略零计数
`compseq {{path/to/input_dna.fasta}} -word 6 {{path/to/output_file.comp}} -nozero`
- 计算特定阅读框中的密码子的观察频率忽略任何重叠计数即按单词长度3移动窗口
`compseq -sequence {{path/to/input_rna.fasta}} -word 3 {{path/to/output_file.comp}} -nozero -frame {{1}}`
- 计算密码子向右移位3个位置的观察频率忽略任何重叠计数应报告除第一个外的所有密码子
`compseq -sequence {{path/to/input_rna.fasta}} -word 3 {{path/to/output_file.comp}} -nozero -frame 3`
- 计算FASTA文件中的氨基酸三联体并与先前运行的`compseq`进行比较,以计算预期和标准化频率值:
`compseq -sequence {{path/to/human_proteome.fasta}} -word 3 {{path/to/output_file1.comp}} -nozero -infile {{path/to/output_file2.comp}}`
- 通过使用提供的输入序列中的单个碱基/残基频率来计算预期频率,从而近似上述命令,而无需预先准备的文件:
`compseq -sequence {{path/to/human_proteome.fasta}} -word 3 {{path/to/output_file.comp}} -nozero -calcfreq`
- 显示帮助(使用`-help -verbose`以获取更多关于相关和一般限定符的信息):
`compseq -help`