17.3. 启动数据库服务器

在任何人可以访问数据库前,你必须启动数据库服务器。 数据库服务器程序为postgres, 它必须知道在哪里能找到它要用的数据。这是利用-D选项实现的。 因此,启动服务器最简单的方法是像下面这样:

$postgres-D/usr/local/pgsql/data

这样将把服务器放在前台运行。这个步骤同样必须以PostgreSQL 用户帐户登录来做。没有-D选项,服务器将使用环境变量 PGDATA命名的目录;如果这个环境变量也没有,将导致失败。

通常,最好在后台启动postgres,使用下面的shell语法

$postgres-D/usr/local/pgsql/data>logfile2>&1&

把服务器的stdoutstderr输出 放到某个地方是非常重要的,就像在上面建议的这样。 这样做既可以帮助审查又可以帮助诊断问题。 参阅Section 23.3获取有关日志文件处理的更完整讨论。

postgres还接受一些其它的一些命令行选项。 更多的信息请参考postgres手册页 和下面的Chapter 18

这些shell语法很容易让人觉得无聊。因此我们提供了封装 程序pg_ctl 以简化一些任务。比如:

pg_ctlstart-llogfile

将在后台启动服务器并且把输出放到指定的日志文件中。 -D选项和你直接运行postgres 时的意思是一样的。pg_ctl还可以用于关闭服务器。

通常,你会希望在计算机启动的时候启动数据库服务器。 自动启动脚本是特定操作系统的。PostgreSQL 自己带了几个,放在contrib/start-scripts目录里。需要root权限安装它们。

不同的系统在引导时有不同的启动守护进程的方法,所以我们建议你先熟悉它。 许多系统有名字称为/etc/rc.local/etc/rc.d/rc.local这样的文件, 其它的还有rc.d目录。不管你怎么做, 都要记住服务器必须以PostgreSQL用户帐户, 而不是root或任何其它用户身份运行。 因此,你可能总是要用su-c'...'postgres这样的命令。比如:

su-c'pg_ctlstart-D/usr/local/pgsql/data-lserverlog'postgres

下面是一些比较详细的与操作系统相关的建议。 请注意把每个例子里的通用值替换成合适的安装路径和用户名。

运行的时候,它的PID是保存在数据目录下的 postmaster.p id文件里的。这样做 是为了避免多个服务器在同一个数据目录内运行,此文件同样可以用于关闭服务器。

17.3.1. 服务器启动失败

有几个常见的原因会导致服务器启动失败。 通过检查服务器日志或使用手工启动的方法(不做stdout和stderr的重定向), 就可以看到错误信息。下面我们更详细地解释了其中一些错误信息。

LOG:couldnotbindIPv4socket:Addressalreadyinuse
HINT:Isanotherpostmasteralreadyrunningonport5432?Ifnot,waitafewsecondsandretry.
FATAL:couldnotcreateTCP/IPlistensocket

就像它提示的那样:你试图在已经有一个服务器运行着的端口上再运行了一个服务器。 不过,如果内核的错误信息不是Address alreadyinuse或者是其它的变种,那就有可能是别的毛病。 比如,试图在一个保留的端口上运行服务器会收到下面这样的信息:

$postgres-p666
LOG:couldnotbindIPv4socket:Permissiondenied
HINT:Isanotherpostmasteralreadyrunningonport666?Ifnot,waitafewsecondsandretry.
FATAL:couldnotcreateTCP/IPlistensocket

像这样的信息:

FATAL:couldnotcreatesharedmemorysegment:Inval  idargument
DETAIL:Failedsystemcallwasshmget(key=5440001,size=4011376640,03600).

可能意味着内核对共享内存区的限制小于PostgreSQL 试图分配的缓冲区大小(本例中是4011376640字节)。或者可能意味着你根本 就没有配置System-V风格的共享内存支持。作为一个临时的解决办法, 你可以试着以小于正常数量的缓冲区数(shared_buffers)启动服务器。 你最终还是会希望重新配置内核,以增加共享内存的尺寸。 如果你试图在同一台机器上启动多个服务器,而且它们所需的总空间超过了内核的限制, 也会报这个错。

像下面这样的错误:

FATAL:couldnotcreatesemaphores:Nospaceleftondevice
DETAIL:Failedsystemcallwassemget(5440126,17,03600).

意味着着你已经用光磁盘空间了。 它的意思是内核的SystemV信号灯的限制小于PostgreSQL 想创建的数量。和上面一样,你可以通过减少允许的连接数(max_connections) 来绕开,但最终你还是会希望修改内核的限制。

如果你收到一个"illegalsystemcall"错误, 那么很有可能是内核根本不支持共享内存或者信号灯。如果是这样的话, 你唯一的选择就是重新配置内核并且把这些特性打开。

关于配置系统SystemVIPC 资源的细节见Section 17.4.1

17.3.2. 客户端连接问题

尽管可能在客户端出现的错误条件范围宽广,而且还和应用相关, 但的确有几种错误与服务器的启动方式直接相关。除了下面提到的几种错误 以外的问题都应该在相应的客户端应用的文档中。

psql:couldnotconnecttoserver:Connectionrefused
Istheserverrunningonhost"server.joe.com"andaccepting
TCP/IPconnectionsonport5432?

通常"Icouldn'tfindaservertotalkto"失败。 当试图进行TCP/IP通讯时它看起来像上面的样子。 常见的错误是忘记把服务器配置成允许TCP/IP连接。

另外,当试图通过一个Unix套接字与本机服务器通讯时,你会看到这个:

psql:couldnotconnecttoserver:Nosuchfileordirectory
Istheserverrunninglocallyandaccepting
connectionsonUnixdomainsocket"/tmp/.s.PGSQL.5432"?

最后一行可以有效地验证客户端进行连接尝试时是否连对了位置。 如果实际上没有服务器在那里运行,典型的内核错误是像上面显示的那样 或者是ConnectionrefusedNosuchfileordirectory。 尤其要注意的是这种环境下Connectionrefused 的信息显示并不意味着服务器收到连接然后拒绝了连接。那 样的话会产生一个不同的信息(像Section 19.4里面显示的那样)。 其它像Connectiontimedout 这样的信息表示更基本的问题,比如缺少网络连接等。