学习笔记Day12:初探LInux 2

Linux初探

同一个目录中不允许出现文件及文件夹重名

查看文件
  1. cat (Concatenate)查看文本文件内容,输出到屏幕(标准输出流)

    • 常用参数

      • -A打印所有字符,包括特殊字符(换行符、制表符等)
      • -n/-b标记行号,-n标记空行,-b不标记空行
    • 常见用法

      cat > file创建一个新文件file,并可以将简单内容写入文件。

      >为重定向符,意为把cat原本输出到屏幕的内容写入file的文件,会覆盖。

      >>追加符,可以继续写入文件,不覆盖。

      zcat可以读压缩文件

    tac倒着看文件(从倒数第一行开始输出)

  2. head 查看文件的前n行(默认10行)

    tail查看文件的后n行(默认10行)

    • 常用参数

      • -n设置看多少行的参数
    • 常见用法

      cat file.txt | head -n3 等价 head -n3 file.txt

      |管道符号

  3. more逐页查看文件,按空格翻页,按回车换行,q退出

    less more的升级版,常用的查看文件命令

    • 常见参数

      • -N 显示行号
      • -S 单行显示(可以上下左右翻阅)
    • 常见用法

      /keyword进行关键词搜索;n/N上下跳转关键词。

  4. wcword count)统计文本

    • 常见参数

      • -l 统计行数(比较常用)
      • -w 统计字符串数,连在一起的字母是一个字符串。
      • -c 统计字节数,包括特殊字符,如换行符和制表符等。
    • 常见用法

      wc -l file1.txt file2.txt file3.txt 输出三个文件行数及总计行数

  5. cut 文本分割

    • 常见参数:

      • -d 指定分隔符,默认\t;
      • -f输出哪几列(字段fields)
    • 常见用法:

      less -SN Data/example.gtf | cut -f 1,3-5 | less 以默认制表符分割成列,取出1,3,4,5列(不会乱序)

  6. sort 排序

    • 常见参数:

      • -n 按照数值从小到大排序(默认是按照字符串理解数字的)
      • -V 字符串中含数值时,按照数值从小到大排序
      • -r 逆向排序
      • -k 按照哪一列进行排序
      • -t 指定分隔符
    • 常见用法

      less exp.csv | sort -k 3 -n| less -SN 根据第3列按照数值排序

  7. uniq 去除重复行,只能去除上下挨着的重复行,需要结合sort使用

    • 常见参数

      • -C 统计每个字符串连续出现的行数
    • 常见用法

      cat file.gtf | cut -f3 | sort | uniq -c 将文件以制表符分割的第三列排序后统计出现了多少次(联想R的table)

  8. paste 文本合并

    • 常见参数
      • -d 指定分隔符
      • -s 按行合并
    • 常见用法
      • paste file1 file2 默认按列合并
      • seq 20 | paste - - 很有意思!试一下!
  9. tr 字符替换

    • 常见参数

      • -d 删除
      • -s 缩减连续重复字符
    • 常见用法

      tr 'a' 'A' 把小写a换成大写A,全部替换

      tr ' ' '\t'把空格替换成制表符

      tr '\n' ' '把换行符替换成空格

MD5
  1. 生成md5值:md5sum file1

  2. 验证md5值:md5sum -c file1.md5

小TIPs
  • 特殊符号:^I\t 制表符;$\n 换行符
  • 把输入文件当作输出文件!会清空文件!需要存为另一个文件

生物信息学常见数据格式

fasta (fasta,fa,fna,faa,fas)

基于文本表示核酸序列的

特征:两部分, id行和序列行

  1. id行:以">"开头,有时候会包含注释信息,如chr1、chr2
  2. 序列行:一个字母表示一个碱基/氨基酸,ATCGN或二十种氨基酸
fastq

一种保存生物序列(通常核酸序列)及其测序质量得分信息的文本格式。

特征:四行组成(行内信息必须一行写完)

  1. 第一行:以@开头,之后为序列的标识符以及描述信息
  2. 第二行:为序列信息,如ATCG等
  3. 第三行:以+开头,之后可以再次加上序列的标识及描述信息(可无信息)
  4. 第四行:为碱基质量值,与第二行序列对应,长度相等
gff

在这里插入图片描述

gtf

在这里插入图片描述

  • gene_idtranscript_id非常重要!!

  • 强制对齐column -t

引用自生信技能树课程~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/470169.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Python+pytest+request 接口自动化测试!

一、环境配置 1.安装python3 brew update brew install pyenv 然后在 .bash_profile 文件中添加 eval “$(pyenv init -)” pyenv install 3.5.3 -v pyenv rehash 安装完成后,更新数据库 pyenv versions 查看目前系统已安装的 Python 版本 pyenv global 3.5…

使用DMA方式控制串口

本身DMA没什么问题,但是最后用GPIOB点灯,就是点不亮。 回到原来GPIO点灯程序,使用GPIOB就是不亮,替换为GPIOA就可以,简单问题总是卡得很伤。

docker-compose一键部署若依前后端分离版本

比如这里把文件放到/xin/docker/jiaoZ/的目录下,jar包和下面的配置文件都放在这个文件夹下。 注意要把jar端口改为你实际启动的,映射端口也可以改为你想要的。 这里的映射端口为:nginx监听80端口,jar在8620端口,mysq…

ProtoBuf-gRPC实践

目录介绍 01.gRPC学习背景 1.1 为什么要学RPC1.2 RPC是什么1.3 网络库收益分析1.4 学习计划说明1.5 学习问题思考 02.ProtoBuf的介绍 2.1 ProtoBuf是什么2.2 ProtoBuf和json2.3 ProtoBuf问题思考2.4 ProtoBuf特点2.5 ProtoBuf存储格式2.6 ProtoBuf优缺点2.7 创建proto文件2.8 …

HashMap设置初始容量为17,那么它的实际容量是多少?

典型回答 即使初始化 HashMap 的容量为 17,那么它的实际容量却是 32。 这是因为 HashMap 的容量只能为 2 的 N次方,这是 HashMap 的源代码中的实现,无论用户输入的是多少,它总会通过计算,得到第一个比他大的2的N 次方…

SPI读写学习

走到初衷使用STM32的地方,例子是读写W25Q,但是手上没有25Q,只有一个SPI接口的SD卡。在UNO上已经实验OK,线接好后,发现SD卡里有个寄存器转换表,跟例子的SPI接口不一样,要改的太多。 u32 SPI_FLAS…

15|BabyAGI:根据气候变化自动制定鲜花存储策略

一种新型的代理——Autonomous Agents(自治代 理或自主代理), 在 LangChain 的代理、工具和记忆这些组件的支持下,它们能够在无需外部干预的情况下自主 运行,这在真实世界的应用中具有巨大的价值。 AutoGPT 它的主要…

Win11用户必备:轻松将右键菜单改回Win10的几种方法

Win11系统的右键菜单相较于Win10系统有所改变,许多用户可能更喜欢Win10系统的样式。下面小编将分享几种方法,帮助用户将Win11的右键菜单恢复为Win10的风格。这些方法简单易行,用户只需按照步骤进行操作即可完成设置,让Win11电脑上…

Flutter 初始WidgetState 简单应用案例分析

本系列文章主要整理Flutter的知识汇总,由浅入深,从Widget的搭建到其中的原理。本文还是围绕Widget在开发中应用和理解。 关于Flutter环境配置和首次创建可以参考前面文章。链接如下: Flutter 安装部署与认识Dart语言 Flutter 使用AndroidS…

湖北省地质灾害分布数据 崩塌滑坡泥石流空间分布地质灾害详查等数据集

地质灾害是指在自然或者人为因素的作用下形成的,对人类生命财产造成的损失、对环境造成破坏的地质作用或地质现象。地质灾害在时间和空间上的分布变化规律,既受制于自然环境,又与人类活动有关,往往是人类与自然界相互作用的结果。…

代码随想录算法训练营第day36|435. 无重叠区间 、 763.划分字母区间 、 56. 合并区间

目录 435. 无重叠区间 763.划分字母区间 56. 合并区间 435. 无重叠区间 力扣题目链接(opens new window) 给定一个区间的集合,找到需要移除区间的最小数量,使剩余区间互不重叠。 注意: 可以认为区间的终点总是大于它的起点。 区间 [1,2] 和 [2,3] …

vue3实现输入框短信验证码功能---全网始祖

组件功能分析 1.按键删除,清空当前input,并跳转prevInput & 获取焦点,按键delete,清空当前input,并跳转nextInput & 获取焦点。按键Home/End键,焦点跳转first/最后一个input输入框。ArrowLeft/ArrowRight键点击…

【日常记录】【插件】使用 html2canvas增加水印

文章目录 1、需求2、html2canvas3、实现4、参考链接 1、需求 实际开发中,经常需要将网页元素转换为图片,以便进行保存、分享或打印等用途。,一般想到的方案就是canvas 比如这个,需要把这个DOM转化成一个图片 2、html2canvas html2canvas 可以把DOM结构转…

vivado 物理优化约束、交互式物理优化

物理优化约束 Vivado Design Suite在物理优化过程中尊重DONT_TOUCH特性。它不在具有这些属性的网络或小区上执行物理优化。要加快网络选择过程中,具有DONT_TOUCH属性的网络经过预过滤,不被考虑用于物理优化。此外,还遵守Pblock分配&#xff…

ClickHouse--13--springboot+mybatis配置clickhouse

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 ClickHouse1.添加maven依赖2.配属数据源3.参数配置4.Druid连接池配置5.entity6.Mapper接口7.Mapper.xml8.controller接口9.创建一个clickhouse表10.测试 ClickHouse…

MySQL数据库概念及MySQL的安装

文章目录 MySQL数据库一、数据库基本概念1、数据2、数据表3、数据库4、数据库管理系统(DBMS)4.1 数据库的建立和维护功能4.2 数据库的定义功能4.3 数据库的操纵功能4.4 数据库的运行管理功能4.5 数据库的通信功能(数据库与外界对接&#xff0…

网络简略总结

目录 一、三次握手 四次挥手 1、三次握手:为了建立长链接进行交互即建立一个会话,使用http/https协议 2、四次挥手是一个断开连接释放服务器资源的过程 3、如果已经建立了连接,但是客户端突然出现故障了怎么办? 4、谁可以中断连接?客户端还是服务端还是都可以? 5、…

小朋友排队(蓝桥杯,acwing,归并)

题目描述: n 个小朋友站成一排。 现在要把他们按身高从低到高的顺序排列,但是每次只能交换位置相邻的两个小朋友。 每个小朋友都有一个不高兴的程度。 开始的时候,所有小朋友的不高兴程度都是 0。 如果某个小朋友第一次被要求交换&#…

解决NameError:name ‘file‘ is not defined 方法

方法1: import os base_diros.path.dirname(os.path.realpath(_file_) print(base_dir)方法2: import os base_diros.getcwd() print(base_dir)

PTA一笔画

作者 张志梅 单位 青岛大学 小丁最近迷恋上一个游戏,传说中的“一笔画”游戏。 那么什么是一笔画?如下图,顾名思义就是一笔可以完成的图。一笔画最基本的要求是在画图的过程中,笔不能离开纸,且笔所画过的线不能重复…
最新文章