CentOS 7下安装owllook在线小说搜索引擎

lisahost.com

一、owllook介绍

owllook是一个基于其他搜索引擎构建的垂直小说搜索引擎,owllook目的是让阅读更简单、优雅,让每位读者都有舒适的阅读体验,如搜书、阅读、收藏、追更、推荐等功能。

owllook使用了mongodb储存了用户使用过程中的产生的基本信息,诸如注册信息、搜索小说信息、收藏小说数据等,对于某些必要的缓存,则利用redis进行缓存处理,如小说缓存、session缓存,注意,对于限制数据:都将在24小时删除

对于不同网站的小说,页面规则都不尽相同,我希望能够在代码解析后再统一展示出来,这样方便且美观,而不是仅仅跳转到对应网站就完事,清新简洁的阅读体验才是最重要的

目前采用的是直接在搜索引擎上进行结果检索,我尽量写少量的规则来完成解析,具体见规则定义,遇到自己喜欢的小说网站,你也可以自己添加解析,owllook目前解析了超过 200+ 网站,追更网站解析了50+

有一些地方需要用到爬虫,比如说排行榜,一些书籍信息等,我不想动用重量级爬虫框架来写,于是我在owllook里面编写了一个很轻量的爬虫框架来做这件事,见 ruia

二、owllook在CentOS 7系统上的安装

先更新系统:

yum -y update

安装EPEL源:

yum -y install epel-release

安装Redis和一些基本组件:

yum -y install redis git curl screen

现在运行并把Redis设置开机自启动:

systemctl start redis
systemctl enable redis

新建一个repo源,用于安装mongodb:

vi /etc/yum.repos.d/mongodb-org-4.0.repo

写入:

[mongodb-org-4.0]
name=MongoDB Repository
baseurl=https://repo.mongodb.org/yum/redhat/$releasever/mongodb-org/4.0/x86_64/
gpgcheck=1
enabled=1
gpgkey=https://www.mongodb.org/static/pgp/server-4.0.asc

然后直接yum安装:

yum -y install mongodb-org

启动mongodb并设置开机启动:

systemctl start mongod
systemctl enable mongod

安装编译安装Python3所需的依赖:

yum -y install gcc make zlib zlib-devel readline readline-devel readline-static openssl openssl-devel openssl-static sqlite-devel bzip2-devel bzip2-libs libffi-devel

跑下面这个脚本安装pyenv:

curl -L https://github.com/pyenv/pyenv-installer/raw/master/bin/pyenv-installer | bash

编辑账户配置文件:

vi ~/.bash_profile

加入如下环境变量:

export PATH="/root/.pyenv/bin:$PATH"
eval "$(pyenv init -)"
eval "$(pyenv virtualenv-init -)"

使其生效:

source ~/.bash_profile

使用pyenv安装python3.6.7:

pyenv install 3.6.7

完成之后创建一个3.6.7的虚拟运行环境:

pyenv virtualenv 3.6.7 owllook

记住你的这个环境路径,如下:

/root/.pyenv/versions/3.6.7/envs/owllook/bin/python3

现在拉取项目并进入到项目目录:

git clone https://github.com/howie6879/owllook
cd owllook

把项目目录的python环境设置为我们刚才创建的:

pyenv local owllook

使用pip安装pipenv:

pip install pipenv

然后使用pipenv安装项目所需依赖:

pipenv install --python /root/.pyenv/versions/3.6.7/envs/owllook/bin/python3

依赖安装完成如图所示,请确保这个过程没有任何错误:

完成之后进入到owllook目录内:

cd owllook

编辑配置文件:

vi config/config.py

找到如下这段代码:

VAL_HOST = os.getenv('VAL_HOST', 'true')

改为:

VAL_HOST = os.getenv('VAL_HOST', 'false')

现在使用screen创建一个新的shell:

screen -S owllook

在新shell内运行程序:

python server.py

不出意外,你可以看到类似下图的回显,就说明项目跑起来了:

现在我们安装Nginx用于反向代理:

yum -y install nginx

新建一个Nginx站点配置文件:

vi /etc/nginx/conf.d/book.conf

写入:

server {
    listen       80;
    server_name  example.com www.example.com;

location / {
    proxy_set_header X-Real-IP $remote_addr;
    proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
    proxy_set_header X-Forwarded-Proto $scheme;
    proxy_set_header Host $http_host;
    proxy_set_header X-NginX-Proxy true;

    proxy_pass http://0.0.0.0:8001;
    proxy_redirect off;

    proxy_http_version 1.1;
    proxy_set_header Upgrade $http_upgrade;
    proxy_set_header Connection "upgrade";
    }
}

重启Nginx:

systemctl restart nginx

关闭防火墙和SElinux:

systemctl stop firewalld.service
systemctl disable firewalld.service
vi /etc/selinux/config
SELINUX=disabled
setenforce 0

现在打开你的站点域名,应该可以正常访问这个程序了:

显示排行榜:

运行spider_console.py:

cd owllook/owllook/spiders

然后用screen创建一个新的shell:

screen -S spider_console

在新shell里执行:

python spider_console.py

owllook项目地址:https://github.com/howie6879/owllook

安装教程全文转自:https://lala.im/4538.html

    所有主机信息仅是为及时分享并收录,不做推荐!