存钱:
本节主要包含以下内容:
Linux 的基本概述和获取生物识别软件
conda/mamba的安装及环境配置
conda/mamba 基本使用流程
用于生物学领域相关研究的软件统称为“生物学软件”。 与我们日常生活中经常接触到的相比,存在着巨大的差异。
所以,“安装软件”这个看似在我们生活的方方面面无所不在、简单得不能再简单的事情,将是拦住大部分生物学领域朋友的第一个绊脚石(当然也是最后一个)。 如果软件安装成功就意味着胜利在望(提前开香槟?)
这类软件通常是基于Linux环境开发的(有的软件只包含几个python脚本,太懒了)。 它只是为了解决某类特定问题而开发的,针对性很强。 与“老朋友”相比(咱们来说说),你钓鱼的时候都用哪些app?
)、获取困难(软件版本和安装方式太多,该选哪一种?)、安装过程繁琐(很多软件依赖和版本冲突)、不好使用(几乎没有图形界面) ,只需输入命令即可运行软件),基本上就是说,“只要能用,你想要什么样的自行车?”
对于初学者来说,生物识别软件就像宇宙中的星星,无数、耀眼、神秘。我们站在地球上,抬头仰望,心生敬畏,却遗憾无法理解其原理,触及其本质。
因此,我把这个新系列命名为“摘星”(
),主要内容有:各种生物识别软件的安装指南、安装过程中报奇怪错误的排查流程、常用shell命令的应用
话不多说,来看看拼道是如何摘星的吧~
01
Linux 概述和获取生物识别软件
在摘星之前,我们需要对Linux有一些初步的了解
Linux是一个自由、开源的操作系统,支持多用户、多任务、多线程和多CPU(相当于Windows,是免费的)
),其内核最初由 Linus Benedict Torvalds 发布(注意他的名字)
当我们通常提到Linux时,我们通常指的是基于Linux内核的一类操作系统。 它们的名字可能不同,但都包括这四个部分:Linux内核、GNU工具、图形桌面环境和应用软件
基于Linux内核的操作系统有很多版本,按照封装方式可以分为:Debian系统、Red Hat系统、Slackware系统等。不同发行版的操作系统基本相同(所有应该包括在内,即使它们不可用,也会被替换)。 药品)。
其中基于Debian的Ubuntu和基于红帽的CentOS在生物领域比较常用(我用的是Ubuntu,所以以后主要用Ubuntu。
),Ubuntu的图形界面如下:
与Windows相比,Linux占用资源更少,运行效率更高,并且具有图形界面。 它更喜欢使用命令行来操作系统和管理日常任务(邪恶的黑匣子)
Linux内核系统可以通过以下方法获取:
源镜像安装:下载release版本对应的安装镜像并安装(步骤与安装Windows操作系统类似)
虚拟机:通过在装有Windows系统的个人计算机上安装虚拟机软件,然后使用虚拟机来管理多个虚拟系统。 您需要安装虚拟机,然后安装release版本对应的镜像。
子系统:在Windows App Store中配置并安装子系统(父是Windows,子是Linux,但是子必须听我的
)
服务器租赁:租一台预装Linux内核操作系统的服务器(服务器也是电脑,但离我们很远)
目前服务器租赁是大多数科研团体的首选(省钱、省心、省人)。 这里主要介绍如何在个人电脑上远程登录服务器、上传文件、部署任务(后续会更新其他部署教程)
在个人电脑上访问服务器,需要使用支持ssh协议的软件,例如Xshell(访问和控制服务器)和Xftp(上传/下载文件到服务器)
两者需要配合使用,缺一不可。 此类软件有很多种,可以根据个人喜好选择(有很多,比如PUTTY、Hyper、Terminus、OpenSSH等,Xshell的界面不是很好看,所以可以用)
Xshell和Xftp的安装和使用
点击免费授权页面单独下载。
安装完成后,桌面上会出现这两个图标(小海螺和绿色文件夹)。
双击“海螺”,界面如下:
点击左上角绿色十字,弹出如下界面。 红框中,主机、协议、端口号为必填项(相关信息请自行查询或向相关人员询问)
然后点击用户认证,输入你的用户名和密码,点击链接即可访问服务器~(
)
然后双击绿色文件夹,界面如下:
还是点击绿色十字,填写相关信息(我之前在海螺里填过)
以上就是bioxin软件涉及的Linux基本内容,接下来“摘星”之旅就正式开始了(笑)~
02
conda/mamba的安装及环境配置
在“摘星”之前,我们需要先了解一下“明星”有哪些类型
Bioxin软件版本有多种,根据安装方式可分为以下两类:
使用conda/mamba安装:Bioxin软件主要是用python编写的,不同的软件需要不同的依赖(主要是不同版本的python、依赖库等软件),安装和管理起来非常麻烦(素食者和肉食者)住在一起……怎么吃饭?),于是conda应运而生,主要用于管理不同版本的软件和python环境(用墙将两者分开,提供个性化服务)
)
源码安装:有些软件没有部署在conda中。 需要下载源码安装包,解压,编译安装(很烦人,经常报错,缺少各种依赖ubuntu软件安装在哪里,非必要不要选择这种方式)
因此,使用conda安装管理软件是我们首选的方式(
)
conda虽然好,但是对我们来说却有一个致命的问题。 它“太慢了”(各种意义上都很慢)
由于国内网络环境(不可抗力)以及conda中各种软件包异常多(太多了,不同软件有不同的依赖关系,每次安装软件都要遍历软件库),使用conda安装软件非常困难。 这是非常非常耗时的(少则一小时,多则三五天)。 好在聪明的老板们开发了mamba软件,效果突出(老板再也不用担心软件安装慢了)
mamba 和 conda 的使用逻辑是完全一样的。 只需将相关命令中的 conda 替换为 mamba 即可。
所以,使用mamba安装管理软件才是我们真正的首选(不然后患无穷)
请参阅下面的曼巴文档:
点击Mambaforge distribution跳转到下载界面
只需根据操作系统版本下载对应的安装包即可。
将下载的安装包传输到服务器上(本例是在个人文件夹下新建一个名为software的文件夹,并将安装包放在该文件夹中),使用cd命令进入software文件夹,执行以下命令启动安装:
bash Miniforge3-Linux-x86_64.sh
按 Enter 继续
继续按Enter键(一路doge),注意不要按太多。 出现提示时您接受许可条款吗? [yes|no],输入yes,然后回车(我这里按太多了,再试一次)
这时弹出如下界面
在这里,我们可以指定mamba的安装目录。 如果不指定,默认会安装到/home/用户名/miniforge3,然后回车等待安装完成。
出现这个提示时,输入yes,执行初始化操作(各位亲不要惊慌,如果这里因为拼写错误导致初始化失败,后面可以使用mamba init命令)
至此,mamba已经安装完毕,但是当我们兴奋的想运行两个命令时,却出现了如下提示: conda: command not found (doge)
为什么? 为什么? 为什么?
因为我们还有尾巴要没收,为了方便我们在电脑的任何地方执行mamba命令,我们需要在系统环境变量中写入该软件的路径信息(告诉电脑去哪里找到这些命令)
接下来我们通过vim软件修改personal文件夹中的.bashrc文件(位于用户的个人文件夹中,存放用户的个性化配置信息)来达到此目的
首先使用cd命令返回个人文件夹
cd
然后,使用以下命令查看个人文件夹下的所有文件/文件夹
ls -a
可以发现当前文件夹下有.bashrc文件
使用vim软件编辑.bashrc文件
vim .bashrc
此时处于文件预览模式(无法修改),需要按i键进入编辑模式。 这时左下角变成INSERT
进入编辑模式后,在.bashrc文件末尾添加以下几行命令
然后按Esc键退出编辑模式并返回预览模式(左下角的INSERT消失)
当vim处于预览模式时,你可以通过一系列命令来管理文档。 这里不再赘述(先退出这个幽灵界面),只介绍两个常用的命令。
:wq 保存相关修改并退出
:q 直接退出
这里我们输入:wq,回车执行,就会回到命令行界面(vim在预览模式下可以通过一系列命令来管理文档,这里不再赘述)
执行source .bashrc命令刷新文件,使配置生效。 这时用户名前面就会多一个(base),这也代表mamba已经安装成功了(不容易)
source .bashrc
03
conda/mamba 基本使用流程
base出现的那一刻,就意味着我们已经有了自己的生物识别软件管理工具,那么如何使用呢?
接下来我们举一个“毛坯房”的例子(久违的连接家庭的例子)
假设你历尽千辛万苦,终于拥有了自己的“毛坯房”(Linux服务器设备)
顾名思义,毛坯房空间广阔,没有任何油漆。 经过一番操作,你对房子的承重墙(底座)进行了加固,这意味着房子目前处于锅碗瓢盆(几乎没有生物识别软件)的状态,根本无法满足日常需求(朋友来玩)只能睡地上)
经过深思熟虑,你决定购买一些家具或基本的生活设施(装修软件)来满足你的日常需求(朋友来的时候有地方住)。 那么去哪里买呢? 当然,大型电商更可靠(anaconda.org),购买过程也很顺利,但接下来我们又面临一个问题:把这么多东西堆在一个毛坯房里真的好吗? 且不说是否好管理,如果来玩的朋友太多ubuntu软件安装在哪里,不小心撞倒了承重墙,房子就没了(
)
想了想,你觉得在这个空间里吃饭睡觉似乎不太合适(确实不合适)。 把家具搬出去后,准备盖房子(再创建几个虚拟环境)。 每个房子都有不同的特点。 功能(卧室、书房、厨房、卫生间……分开,互不干扰),以后想去哪儿就去哪儿(笑)
房屋建成后,您将具有相应功能的家具移动到相应的房屋中(在新的虚拟环境中安装软件)。 这时,这座“毛坯房”终于有了家的样子了(
)
忙碌了一天,你回到卧室,在柜子里找到积木(你的数据),躺在床上把玩(用相关软件分析数据),最后舒舒服服、幸福地睡着了(你终于可以睡觉了)
因此,在使用mamba安装管理软件时,切记不要将软件直接安装到默认的基础虚拟环境中。 base包含了conda/mamba等一系列比较重要的核心组件。 如果因为安装其他软件而产生依赖冲突,那就和砸承重墙不一样了!
正确的软件安装流程应该是:
首先,为某种类型的工作/某种软件创建专用的虚拟环境(建造房屋)
然后,在这个虚拟环境中安装这些软件(将具有相应功能的家具搬进房子里)。 该软件最好来自anaconda.org(家具是从大型电子商务公司购买的)
最后,当你想进行相关分析时,只需进入相应的虚拟环境即可(睡在卧室,做饭在厨房)
接下来我们安装一个比较常用的信息生成软件blast,详细介绍一下上面的过程。
我们先盖房子吧。 门牌号称为爆炸。 使用以下命令创建虚拟环境:
mamba create -n xxx # xxx为你的环境名,本例中为blast
房子已经准备好了,你进去看看吧? 使用以下命令激活刚刚创建的虚拟环境:
mamba activate xxx # xxx 为你的环境名,本例中为blast
成功进入房间后,左边的基地会变成门牌号(虚拟环境的名称)
此时,打开电商网站,搜索您需要购买的商品。建议在anaconda.org上查找所需的软件
运行以下命令将家具搬进屋内(在爆炸环境中安装爆炸软件)
mamba install -c bioconda blast # -c 设定软件下载的频道
需要注意的是,需要把conda替换成mamba,这个命令才会调用mamba下载相关软件(大大提速,不然会慢到怀疑人生)
这里输入Y即可下载软件及相关依赖,等待安装完成(有货,有货)
家具布置好后,让我们玩一分钟(测试)。 出现如下提示,说明blast已经安装成功。
04
总结
本节主要介绍生物识别软件安装相关内容。 内容比较基础,基础才是最重要的。
学习计算机语言是漫长而无聊的
我希望我踩到了陷阱
我很荣幸能够成为您前进的垫脚石。
我们下次见(笑)
今天的故事怎么样?
咱们下次听分解吧!
下一次更新会是什么?...
关于本文的任何问题(内容批评和更正、布局相关等)
欢迎发送邮件至
liqiushi192@mails.ucas.ac.cn
期待您的建议~
参考资料和其他材料:
R 食谱,第二版 (rc2e.com)
R 包,第二版 (r-pkgs.org)
Linux命令行与shell脚本编程百科全书,第4版,人民邮电出版社