shell中多行变一行的方法zt

0

文本内容:
$cat test.txt
001
002
003
004
005
006
0000999
需要格式化成:
001 002 003 004 005 006 0000999
方法一、最好的答案是waker老大提供的,就不解释了:
xargs < test.txt
方法二、整个文件读入一个变量,然后直接打印,也很容易理解,dolphinlater提供:
a=`cat test.txt`;echo $a

方法三、使用tr把换行符替换成空格:
tr -s “\n” ” ” < test.txt;echo
方法四、使用sed,把整个文件读入保持空间,处理最后一行的时候,替换所有换行符为空格,打印:
sed -n ’1h;1!H;${g;s/\n/ /g;p;}’ test.txt
方法五、使用awk,读入一行打印一行,但是不打印换行符,最后一行多打印一个换行符:
awk ‘{printf(“%s “,$0);}END{print}’ test.txt
方法六、使用paste命令格式化打印,-d指定分隔符,-s表示合并成一行:
paste -d” ” -s – < test.txt
方法七、使用pr格式化打印,-s指定分隔符,-50指定每行打印多少域,-t指定取消页眉、页尾:
pr -50t -s” ” test.txt

Linux安装perl DBD-mysql驱动

0

到http://www.cpan.org/modules/by-module/DBD/找到最新的版本,现在最新的为DBD-mysql-4.020.tar.gz
开始下载安装:

  1. wget http://www.cpan.org/modules/by-module/DBD/DBD-mysql-4.020.tar.gz
  2. tar xzvf DBD-mysql-4.020.tar.gz
  3. cd DBD-mysql-4.020
  4. perl Makefile.PL –mysql_config=/usr/local/mysql/bin/mysql_config
  5. make
  6. make install

请确保mysql_config的路径正确。

find 按时间查找

0

find / -amin -10 # 查找在系统中最后10分钟访问的文件
find / -atime -2 # 查找在系统中最后48小时访问的文件

find / -mmin -5 # 查找在系统中最后5分钟里修改过的文件
find / -mtime -1 # 查找在系统中最后24小时里修改过的文件

find / -cmin -5 # 查找在系统中最后5分钟里被改变状态的文件
find / -ctime -1 # 查找在系统中最后24小时里被改变状态的文件

访问过用amin,修改过用mmin,文件状态改变过用cmin
精确到分钟的用amin,mmin,cmin,精确到天的用atime,mtime,ctime
在5分钟之内的用-5,在5分钟以上的用+5

10表示 =10
-10表示 <=10
+10表示 >10

>=10 可以用大于或等于 \( -cmin +10 -o -cmin 10 \)
< 可以用 不大于等于表示 \! \ ( -cmin +10 -o -cmin 10 \)

mysql timestamp时间运算

0
mysql> select updated_at,DATE_ADD(updated_at,INTERVAL 1 SECOND) from fs_thread limit 2;
+———————+—————————————-+
| updated_at          | DATE_ADD(updated_at,INTERVAL 1 SECOND) |
+———————+—————————————-+
| 2008-10-09 10:22:32 | 2008-10-09 10:22:33                    |
| 2008-10-12 23:53:04 | 2008-10-12 23:53:05                    |
+———————+—————————————-+
2 rows in set (0.00 sec)

Bash shell中的位置参数$#,$*,$@,$0,$1,$2…及特殊参数$?,$-等的含义

0

在Bash shell中经常会见到一些比较特殊的符号,本人现收集与此,以供查阅:

位置参数:
详见ABS(Advanced Bash Shell)中文翻译版103页第9章第一节内部变量,当然英文版ABS都一样啦

$0, $1, $2,等等…
位置参数,从命令行传递给脚本,或者是传递给函数.或者赋职给一个变量.
(具体见Example 4-5 和Example 11-15)
$0表示当前执行的进程名,script 本身的名字,或者在正则表达式中表示整行输出

$#
命令行或者是位置参数的个数.(见Example 33-2)
$*
所有的位置参数,被作为一个单词.
注意:”$*”必须被”"引用.
$@
与$*同义,但是每个参数都是一个独立的”"引用字串,这就意味着参数被完整地传递,
并没有被解释和扩展.这也意味着,每个参数列表中的每个参数都被当成一个独立的单词.
注意:”$@”必须被”"引用.

其他的特殊参数
$-
传递给脚本的falg(使用set 命令).参考Example 11-15.
注意:这起初是ksh 的特征,后来被引进到Bash 中,但不幸的是,在Bash 中它看上去也不
能可靠的工作.使用它的一个可能的方法就是让这个脚本进行自我测试(查看是否是交
互的).
$!
在后台运行的最后的工作的PID(进程ID).
$_
保存之前执行的命令的最后一个参数.
$?
命令,函数或者脚本本身的退出状态(见Example 23-7)
用于检查上一个命令,函数或者脚本执行是否正确。(在Linux中,命令退出状态为0表示该命令正确执行,任何非0值表示命令出错。)
$$
脚本自身的进程ID.这个变量经常用来构造一个”unique”的临时文件名.
(参考Example A-13,Example 29-6,Example 12-28 和Example 11-25).
这通常比调用mktemp 来得简单.
注意事项:
[1] 当前运行的脚本的PID 为$$.
[2] “argument”和”parameter”这两个单词经常不加区分的使用.在这整本书中,这两个
单词的意思完全相同.(在翻译的时候就未加区分,统统翻译成参数)

退出和返回
退出状态(exit status)
函数返回一个被称为退出状态的值. 退出状态可以由return 来指定statement, 否则函数的
退出状态是函数最后一个执行命令的退出状态(0 表示成功,非0 表示出错代码). 退出状态
(exit status)可以在脚本中由$? 引用. 这个机制使脚本函数也可以像C 函数一样有一个”
返回值”.
return
终止一个函数.return 命令[1]可选地带一个整数参数,这个整数作为函数的”返回值”返回
给调用此函数的脚本,并且这个值也被赋给变量$?.

while true可以写为while :

 

Example 23-7 两个数中的最大者
###################Start Script#################
1 #!/bin/bash
2 # max.sh: 两个整数中的最大者.
3
4 E_PARAM_ERR=-198 # 如果传给函数的参数少于2 个时的返回值.
5 EQUAL=-199 # 如果两个整数值相等的返回值.
6 # 任一个传给函数的参数值溢出
7 #
8
9 max2 () # 返回两个整数的较大值.
10 { # 注意: 参与比较的数必须小于257.
11 if [ -z "$2" ]
12 then
13 return $E_PARAM_ERR
14 fi
15
16 if [ "$1" -eq "$2" ]
17 then
18 return $EQUAL
19 else
20 if [ "$1" -gt "$2" ]
21 then
22 return $1
23 else
24 return $2
25 fi
26 fi
27 }
28
29 max2 33 34
30 return_val=$?
31
32 if [ "$return_val" -eq $E_PARAM_ERR ]
33 then
34 echo “Need to pass two parameters to the function.”
35 elif [ "$return_val" -eq $EQUAL ]
36 then
37 echo “The two numbers are equal.”
38 else
39 echo “The larger of the two numbers is $return_val.”
40 fi
41
42
43 exit 0
44
45 # 练习 (容易):
46 # —————
47 # 把这个脚本转化成交互式的脚本,
48 #+ 也就是说,让脚本可以要求调用者输入两个整数.
#####################End Script##################

MySQL UUID函数的详解[zt]

0

MySQL UUID函数的详解

MySQL中可以有二类用于生成唯一值性质的工具:UUID()函数和自增序列,那么二者有何区别呢?我们就此对比下各自的特性及异同点:

l  都可以实现生成唯一值的功能;

l  UUID是可以生成时间、空间上都独一无二的值;自增序列只能生成基于表内的唯

一值,且需要搭配使其为唯一的主键或唯一索引;

l  实现方式不一样,UUID是随机+规则组合而成的,而自增序列是控制一个值逐步增长的;

l  UUID产生的是字符串类型值,固定长度为:36个字符,而自增序列产生的是整数类型值,长度由字段定义属性决定;

 

接下来,详细讲解下UUID()函数产生的值:

oot@localhost : (none) 06:09:40> SELECT UUID(),UUID(),LENGTH(UUID()),CHAR_LENGTH(UUID())\G

*************************** 1. row ***************************

UUID(): de7ee638-4322-11e0-85ab-842b2b4a7e75

UUID(): de7ee642-4322-11e0-85ab-842b2b4a7e75

LENGTH(UUID()): 36

CHAR_LENGTH(UUID()): 36

1 row in set (0.00 sec)

 

从上面的执行结果部分的信息看

l  同一个SQL语句中,多处调用UUID()函数得到的值不相同;

l  得到的随机值由5个部分组成,且分隔符位为:中划线;

l  多次调用或执行得到的后2组值相同,若把mysqld服务器关闭,重新启动之后,会发现第四组的组与未重启前的值发生变化,然后一直不变化,只要重新启动mysqld服务就会发生变化。另外,对于同一台机器,第五组值始终不会发生变化;

l  字符个数为:36,占字节数为:36(注:系统默认字符集编码:utf8);

 

针对UUID产生的值组成部分,作如下解说:

l  前三组值是时间戳换算过来的;

l  第四组值是暂时性保持时间戳的唯一性。例如,使用夏令时;

l  第五组值是一个IEE 802的节点标识值,它是空间上唯一的。若后者不可用,则用一个随机数字替换。假如主机没有网卡,或者我们不知道如何在某系统下获得机器地址,则空间唯一性就不能得到保证,即使这杨,出现重复值的机率还是非常小的。

 

UUID函数对复制的支持:

UUID函数属于不确定性函数,为此不支持MySQL 复制的STATEMENT模式,但是支持MIXED、ROW二种模式,大家可以设置2组测试模式,以5.1.系列版本为例。

测试基于命令行模式复制:

tx_isolation = REPEATABLE-READ

binlog_format = STATEMENT

 

测试基于命令行/混合模式复制:

tx_isolation = REPEATABLE-READ

binlog_format = MIXED  OR ROW

 

在主服务器上执行同一个SQL语句:

INSERT INTO  test_uuid(username) VALUES(UUID());

然后再比对主从服务器上表中存储的值,会发现基于命令行模式的:主从不一致,基于行/混合模式的:主从数据时一致;

 

建议:在复制模式下,需要用到UUID()函数,则一定要使用基于行/混合模式复制方式。

名词解释:

对于输入参数相同,且同一时间执行或一个SQL中多处调用,而得到不同值得函数,我们就称其为:不确定性函数

备注:

在MySQL 5.1.*及更高版本有一个变种的UUID()函数,名称:UUID_SHORT(),生成一个64位无符号的整数,例如:

root@localhost : (none) 02:46:42> SELECT UUID_SHORT()\G

*************************** 1. row ***************************

UUID_SHORT(): 6218676250261585921

1 row in set (0.00 sec)

 

后续加注:

UUID()函数产生的值,并不适合作为InnoDB引擎表的主键,至于详细的原因,请阅读文章InnoDB引擎表的主键选型

 

原创文章,转载请注明: 文章地址MySQL UUID函数的详解

MYSQL复制参数binlog_format

0

MySQL Replication复制可以是基于一条语句(Statement level),也可以是基于一条记录(Row level),可以在MySQL的配置参数中设定这个复制级别,不同复制级别的设置会影响到Master端的bin-log记录成不同的形式。

Row Level:日志中会记录成每一行数据被修改的形式,然后在slave端再对相同的数据进行修改。

优点:在row level模式下,bin-log中可以不记录执行的sql语句的上下文相关的信息,仅仅只需要记录那一条记录被修改了,修改成什么样了。所以row level的日志内容会非常清楚的记录下每一行数据修改的细节,非常容易理解。而且不会出现某些特定情况下的存储过程,或function,以及trigger的调用和触发无法被正确复制的问题。

缺点:row level下,所有的执行的语句当记录到日志中的时候,都将以每行记录的修改来记录,这样可能会产生大量的日志内容,比如有这样一条update语句:update product set owner_member_id = ‘b’ where owner_member_id = ‘a’,执行之后,日志中记录的不是这条update语句所对应额事件(MySQL以事件的形式来记录bin-log日志),而是这条语句所更新的每一条记录的变化情况,这样就记录成很多条记录被更新的很多个事件。自然,bin-log日志的量就会很大。尤其是当执行alter table之类的语句的时候,产生的日志量是惊人的。因为MySQL对于alter table之类的表结构变更语句的处理方式是整个表的每一条记录都需要变动,实际上就是重建了整个表。那么该表的每一条记录都会被记录到日志中。

Statement Level:每一条会修改数据的sql都会记录到 master的bin-log中。slave在复制的时候sql进程会解析成和原来master端执行过的相同的sql来再次执行。

优点:statement level下的优点首先就是解决了row level下的缺点,不需要记录每一行数据的变化,减少bin-log日志量,节约IO,提高性能。因为他只需要记录在Master上所执行的语句的细节,以及执行语句时候的上下文的信息。

缺点:由于他是记录的执行语句,所以,为了让这些语句在slave端也能正确执行,那么他还必须记录每条语句在执行的时候的一些相关信息,也就是上下文信息,以保证所有语句在slave端杯执行的时候能够得到和在master端执行时候相同的结果。另外就是,由于MySQL现在发展比较快,很多的新功能不断的加入,使MySQL得复制遇到了不小的挑战,自然复制的时候涉及到越复杂的内容,bug也就越容易出现。在statement level下,目前已经发现的就有不少情况会造成MySQL的复制出现问题,主要是修改数据的时候使用了某些特定的函数或者功能的时候会出现,比如:sleep()函数在有些版本中就不能真确复制,在存储过程中使用了last_insert_id()函数,可能会使slave和master上得到不一致的id等等。由于row level是基于每一行来记录的变化,所以不会出现类似的问题。

从官方文档中看到,之前的MySQL一直都只有基于statement的复制模式,直到5.1.5版本的MySQL才开始支持row level的复制。从5.0开始,MySQL的复制已经解决了大量老版本中出现的无法正确复制的问题。但是由于存储过程的出现,给MySQL Replication复制又带来了更大的新挑战。另外,看到官方文档说,从5.1.8版本开始,MySQL提供了除Statement Level和Row Level之外的第三种复制模式:Mixed,实际上就是前两种模式的结合。在Mixed模式下,MySQL会根据执行的每一条具体的sql语句来区分对待记录的日志形式,也就是在Statement和Row之间选择一种。新版本中的Statment level还是和以前一样,仅仅记录执行的语句。而新版本的MySQL中队row level模式也被做了优化,并不是所有的修改都会以row level来记录,像遇到表结构变更的时候就会以statement模式来记录,如果sql语句确实就是update或者delete等修改数据的语句,那么还是会记录所有行的变更。

Note:

A.基于SQL语句的复制(statement-based replication, SBR)

B.基于行的复制(row-based replication, RBR)

C.混合模式复制(mixed-based replication, MBR)

相应地,binlog的格式也有三种:STATEMENT,ROW,MIXED。 MBR 模式中,SBR 模式是默认的。

在运行时可以动态改变binlog的格式,除了以下几种情况:

1. 存储过程或者触发器中间

2. 启用了NDB

3. 当前会话使用 RBR 模式,并且已打开了临时表

如果binlog采用了 MIXED 模式,那么在以下几种情况下会自动将binlog的模式由 SBR 模式改成 RBR 模式。

1. 当DML语句更新一个NDB表时

2. 当函数中包含 UUID() 时

3. 2个及以上包含 AUTO_INCREMENT 字段的表被更新时

4. 执行 INSERT DELAYED 语句时

5. 用 UDF(User-defined function) 时

6. 视图中必须要求使用 RBR 时,例如创建视图是使用了 UUID() 函数

设定主从复制模式的方法非常简单,只要在以前设定复制配置的基础上,再加一个参数:

binlog_format="STATEMENT"
#binlog_format="ROW"
#binlog_format="MIXED"

当然了,也可以在运行时动态修改binlog的格式。例如

mysql> SET SESSION binlog_format = 'STATEMENT';
mysql> SET SESSION binlog_format = 'ROW';
mysql> SET SESSION binlog_format = 'MIXED';

mysql> SET GLOBAL binlog_format = 'STATEMENT';
mysql> SET GLOBAL binlog_format = 'ROW';
mysql> SET GLOBAL binlog_format = 'MIXED';

SBR和RBR各自的优缺点

SBR 的优点:

1. 历史悠久,技术成熟

2. binlog文件较小

3. binlog中包含了所有数据库更改信息,可以据此来审核数据库的安全等情况

4. binlog可以用于实时的还原,而不仅仅用于复制

5. 主从版本可以不一样,从服务器版本可以比主服务器版本高

SBR 的缺点:

1. 不是所有的UPDATE语句都能被复制,尤其是包含不确定操作的时候。

2. 调用具有不确定因素的 UDF 时复制也可能出问题

3. 使用以下函数的语句也无法被复制:
* LOAD_FILE()
* UUID()
* USER()
* FOUND_ROWS()
* SYSDATE() (除非启动时启用了 –sysdate-is-now 选项)

4. INSERT … SELECT 会产生比 RBR 更多的行级锁

5. 复制需要进行全表扫描(WHERE 语句中没有使用到索引)的 UPDATE 时,需要比 RBR 请求更多的行级锁

6. 对于有 AUTO_INCREMENT 字段的 InnoDB表而言,INSERT 语句会阻塞其他 INSERT 语句

7. 对于一些复杂的语句,在从服务器上的耗资源情况会更严重,而 RBR 模式下,只会对那个发生变化的记录产生影响

8. 存储函数(不是存储过程)在被调用的同时也会执行一次 NOW() 函数,这个可以说是坏事也可能是好事

9. 确定了的 UDF 也需要在从服务器上执行

10. 数据表必须几乎和主服务器保持一致才行,否则可能会导致复制出错

11. 执行复杂语句如果出错的话,会消耗更多资源

RBR 的优点:

1. 任何情况都可以被复制,这对复制来说是最安全可靠的

2. 和其他大多数数据库系统的复制技术一样

3. 多数情况下,从服务器上的表如果有主键的话,复制就会快了很多

4. 复制以下几种语句时的行锁更少:
* INSERT … SELECT
* 包含 AUTO_INCREMENT 字段的 INSERT
* 没有附带条件或者并没有修改很多记录的 UPDATE 或 DELETE 语句

5. 执行 INSERT,UPDATE,DELETE 语句时锁更少

6. 从服务器上采用多线程来执行复制成为可能

RBR 的缺点:

1. binlog 大了很多

2. 复杂的回滚时 binlog 中会包含大量的数据

3. 主服务器上执行 UPDATE 语句时,所有发生变化的记录都会写到 binlog 中,而 SBR 只会写一次,这会导致频繁发生binlog 的并发写问题

4. UDF 产生的大 BLOB 值会导致复制变慢

5. 无法从 binlog 中看到都复制了写什么语句

6. 当在非事务表上执行一段堆积的SQL语句时,最好采用 SBR 模式,否则很容易导致主从服务器的数据不一致情况发生

另外,针对系统库 mysql 里面的表发生变化时的处理规则如下:

1. 如果是采用 INSERT,UPDATE,DELETE 直接操作表的情况,则日志格式根据 binlog_format 的设定而记录

2. 如果是采用 GRANT,REVOKE,SET PASSWORD 等管理语句来做的话,那么无论如何都采用 SBR 模式记录

注:采用 RBR 模式后,能解决很多原先出现的主键重复问题
mysql binlog格式与事务级别read committed的关系

binlog有三种格式,分别是STATEMENT、row、mixed。每种格式的区别可以去看复制那篇文章,那它分别与read committed 有什么关系呢。下面以例子来分析

1、数据库版本

mysql> status

mysql  Ver 14.14 Distrib 5.1.45, for unknown-linux-gnu (x86_64) using  EditLine wrapper

Connection id:          2
Current database:       xinying
Current user:           root@localhost
SSL:                    Not in use
Current pager:          stdout
Using outfile:          ''
Using delimiter:        ;
Server version:         5.1.45-VS-log XinYing
Protocol version:       10
Connection:             Localhost via UNIX socket
Insert id:              2
Server characterset:    latin1
Db     characterset:    latin1
Client characterset:    latin1
Conn.  characterset:    latin1
UNIX socket:            /tmp/mysql.sock
Uptime:                 1 hour 40 min 14 sec

2、改变事务级别为read committed

mysql>set session transaction isolation level read committed;
Query OK, 0 rows affected (0.00 sec)

3、改变二进制日志格式

mysql>set binlog_format=STATEMENT;
Query OK, 0 rows affected (0.00 sec)

4、创建测试表

mysql>CREATE TABLE `slevin` (
    ->`id` int(10) NOT NULL AUTO_INCREMENT,
    ->`book` char(10) DEFAULT NULL,
    ->PRIMARY KEY (`id`)
    ->) ENGINE=InnoDB;
Query OK, 0 rows affected (0.03 sec)

5、插入数据测试

mysql>insert into slevin(book) values('wuli');
ERROR 1598 (HY000): Binary logging not possible. Message: Transaction level 'READ-COMMITTED' in InnoDB is not safe for binlog mode 'STATEMENT'

看到没,提示出错,那我们尝试把事务基本改为REPEATABLE READ

mysql>set session transaction isolation level REPEATABLE READ;
Query OK, 0 rows affected (0.00 sec)

mysql>insert into slevin(book) values('wuli');
Query OK, 1 row affected (0.00 sec)

改个事务级别就成功了,那试试仍旧把它改为read committed,把binlog格式改了试试

mysql>set session transaction isolation level read committed;
Query OK, 0 rows affected (0.00 sec)

mysql>set session binlog_format=row;   改为行格式
Query OK, 0 rows affected (0.00 sec)

mysql>insert into slevin(book) values('wuli');
Query OK, 1 row affected (0.00 sec)

mysql>set session binlog_format=mixed; 改为混合格式
Query OK, 0 rows affected (0.00 sec)

mysql>insert into slevin(book) values('wuli');
Query OK, 1 row affected (0.00 sec)

把上面改为两种格式都成功,唯独STATEMENT格式不行,所以以后要注意read committed与binlog格式的关系,否则会导致插入不了数据。为何会导致这种情况呢,那是因为read committed可能会导致不可重复读,也就是说可以读取到后面进入并提交的数据,如果基于STATEMENT格式的话,会导致主从数据不一样,因为STATEMENT是基于SQL语句的复制模式。另外设置innodb_locks_unsafe_for_binlog=1 ,binlog也要设为row格式。
UUID做主键分析

大概使用MySQL的人,百分之九九以上的人会使用Autoincrement ID做主键,这是可以理解的,因为MySQL的自增ID效率很高,使用也很方便。那么剩下的百分之一的人使用什么做主键呢?

可能是自己做的KeyGenerator,也可能是我们下面要说的UUID。

据说在Oracle的圈子里,如果谁用自增ID做主键是要被鄙视的,主键最自然的选择就是UUID。

那么我们先看看什么是UUID?

简单的说,UUID是指在一台机器上生成的数字,它保证对在同一时空中的所有机器都是唯一的。在UUID的算法中,可能会用到诸如网卡MAC地址,IP,主机名,进程ID等信息以保证其独立性。

如果你的MySQL版本不太老的话,键入 SELECT UUID(); 输出的就是UUID,如下:

mysql> select uuid();
+--------------------------------------+
| uuid()                               |
+--------------------------------------+
| 54b4c01f-dce0-102a-a4e0-462c07a00c5e |
+--------------------------------------+

现在大家应该对UUID有一个比较直观的认识了,我们来看看UUID的优缺点分别是什么。

优点:

能够保证独立性,程序可以在不同的数据库间迁移,效果不受影响。

保证生成的ID不仅是表独立的,而且是库独立的,这点在你想切分数据库的时候尤为重要。

缺点:

比较占地方,和INT类型相比,存储一个UUID要花费更多的空间。

使用UUID后,URL显得冗长,不够友好。

下面针对上述UUID的缺点说说我的看法,比较占地方这个缺点我不是很在乎,现在最不值钱的就是硬盘了,略过此条缺点无妨,但需要注意的一点数据在索引的时候效率会随着体积的增加而降低。至于说使用UUID后,URL显得不友好,我觉得这多少是你的INT情结造成的惯性思维,其实,和INT类型相比,UUID才是最自然的主键选择,注意,我这里用的是自然这个形容词,仔细体会一下你能理解我的意思。另外,很多时候,URL本身就不需要友好,比如,一个电子商务网站,按照INT友好的URL说法,她的订单URL大概是下面这个形式的:/order.php/id/123,我要说明的是,这样是很友好,但是有些太友好了,友好的甚至不安全,比如说,我早晨下一个订单,发现URL是/order.php/id/1000,晚上再下一个订单发现URL是/order.php/id/2000,那么我就可以估计出此网站一天的订单数大致是1000左右,甚至能大体估计出它的销售额,而这些数据往往都是重要的商业秘密。使用UUID就没有这个顾虑。

如果上面说的UUID的所谓缺点都不成立的话,那么是否使用UUID做主键,唯一的问题就是效率了。据说在PostgreSQL等数据库里,都有专门的UUID类型,在这样的数据库里,使用UUID做主键,效率没有任何问题,可惜在MySQL里没有这样的字段,如果想在MySQL里保存UUID做主键,一般是使用CHAR(36)来模拟,因为不是一个原生的UUID类型,所以主键的效率到底如何有待测试,另外,UUID做主键的效率和UUID本身的算法实现也有很大关系。

另外,对于InnoDB这种聚集主键类型的引擎来说,数据会按照主键进行排序,由于UUID的无序性,InnoDB会产生巨大的IO压力,此时不适合使用UUID做物理主键,可以把它作为逻辑主键,物理主键依然使用自增ID。

http://hi.baidu.com/thinkinginlamp/blog/item/c609d10979710e81d0581b60.html
http://xinying.blog.51cto.com/441770/314203

配置mysql丛库小心使用replicate_do_db和replicate_ignore_db

0

小心使用replicate_do_db和replicate_ignore_db2009-01-07 15:54使用replicate_do_db和replicate_ignore_db时有一个隐患,跨库更新时会出错
如设置 replicate_do_db=test
use mysql;
update test.table1 set ……
第二句将不会被执行
如设置 replicate_ignore_db=mysql
use mysql;
update test.table1 set ……
第二句会被忽略执行
原因是设置replicate_do_db或replicate_ignore_db后,MySQL执行sql前检查的是当前默认数据库,所以跨库更新语句被忽略。
可以使用replicate_wild_do_table和replicate_wild_ignore_table来代替

replicate_wild_do_table=test.%

replicate_wild_ignore_table=mysql.%
这样就可以避免出现上述问题了

MYSQL TIMESTAMP时间戳介绍

0

如果要实现你某列的默认值为当前更新日期与时间的功能,
你可以使用TIMESTAMP列类型

下面就详细说明TIMESTAMP列类型

TIMESTAMP列类型
TIMESTAMP值可以从1970的某时的开始一直到2037年,精度为一秒,其值作为数字显示。
TIMESTAMP值显示尺寸的格式如下表所示:

+—————+—————-+
| 列类型    | 显示格式    |
| TIMESTAMP(14) | YYYYMMDDHHMMSS |
| TIMESTAMP(12) | YYMMDDHHMMSS  |
| TIMESTAMP(10) | YYMMDDHHMM   |
| TIMESTAMP(8) | YYYYMMDD    |
| TIMESTAMP(6) | YYMMDD     |
| TIMESTAMP(4) | YYMM      |
| TIMESTAMP(2) | YY       |
+—————+—————-+
“完整”TIMESTAMP格式是14位,但TIMESTAMP列也可以用更短的显示尺寸创造
最常见的显示尺寸是6、8、12、和14。
你可以在创建表时指定一个任意的显示尺寸,但是定义列长为0或比14大均会被强制定义为列长14。
列长在从1~13范围的奇数值尺寸均被强制为下一个更大的偶数。

列如:
定义字段长度   强制字段长度
TIMESTAMP(0) -> TIMESTAMP(14)
TIMESTAMP(15)-> TIMESTAMP(14)
TIMESTAMP(1) -> TIMESTAMP(2)
TIMESTAMP(5) -> TIMESTAMP(6)

所有的TIMESTAMP列都有同样的存储大小,
使用被指定的时期时间值的完整精度(14位)存储合法的值不考虑显示尺寸。
不合法的日期,将会被强制为0存储

这有几个含意:

1、虽然你建表时定义了列TIMESTAMP(8),但在你进行数据插入与更新时TIMESTAMP列实际上保存了14位的数据(包括年月日时分秒),只不过在你进行查询时MySQL返回给你的是8位的年月日数据。如果你使用ALTER TABLE拓宽一个狭窄的TIMESTAMP列,以前被“隐蔽”的信息将被显示。
2、同样,缩小一个TIMESTAMP列不会导致信息失去,除了感觉上值在显示时,较少的信息被显示出。
3、尽管TIMESTAMP值被存储为完整精度,直接操作存储值的唯一函数是UNIX_TIMESTAMP();由于MySQL返回TIMESTAMP列的列值是进过格式化后的检索的值,这意味着你可能不能使用某些函数来操作TIMESTAMP列(例如HOUR()或SECOND()),除非 TIMESTAMP值的相关部分被包含在格式化的值中。例如,一个TIMESTAMP列只有被定义为TIMESTAMP(10)以上时, TIMESTAMP列的HH部分才会被显示,因此在更短的TIMESTAMP值上使用HOUR()会产生一个不可预知的结果。
4、不合法TIMESTAMP值被变换到适当类型的“零”值(00000000000000)。(DATETIME,DATE亦然)

你可以使用下列语句来验证:
CREATE TABLE test (‘id’ INT (3) UNSIGNED AUTO_INCREMENT, ‘date1′ TIMESTAMP (8) PRIMARY KEY(‘id’));
INSERT INTO test SET id = 1;
SELECT * FROM test;
+—-+—————-+
| id | date1     |
+—-+—————-+
| 1 | 20021114    |
+—-+—————-+
ALTER TABLE test CHANGE ‘date1′ ‘date1′ TIMESTAMP(14);
SELECT * FROM test;
+—-+—————-+
| id | date1     |
+—-+—————-+
| 1 | 20021114093723 |
+—-+—————-+

你可以使用TIMESTAMP列类型自动地用当前的日期和时间标记INSERT或UPDATE的操作。
如果你有多个TIMESTAMP列,只有第一个自动更新。

自动更新第一个TIMESTAMP列在下列任何条件下发生:

1、列值没有明确地在一个INSERT或LOAD DATA INFILE语句中指定。
2、列值没有明确地在一个UPDATE语句中指定且另外一些的列改变值。(注意一个UPDATE设置一个列为它已经有的值,这将不引起TIMESTAMP列被更新,因为如果你设置一个列为它当前的值,MySQL为了效率而忽略更改。)
3、你明确地设定TIMESTAMP列为NULL.
4、除第一个以外的TIMESTAMP列也可以设置到当前的日期和时间,只要将列设为NULL,或NOW()。

CREATE TABLE test (
‘id’ INT (3) UNSIGNED AUTO_INCREMENT,
‘date1′ TIMESTAMP (14),
‘date2′ TIMESTAMP (14),
PRIMARY KEY(‘id’)
);

INSERT INTO test (id, date1, date2) VALUES (1, NULL, NULL);
INSERT INTO test SET id= 2;
+—-+—————-+—————-+
| id | date1     | date2     |
+—-+—————-+—————-+
| 1 | 20021114093723 | 20021114093723 |
| 2 | 20021114093724 | 00000000000000 |
+—-+—————-+—————-+

->第一条指令因设date1、date2为NULL,所以date1、date2值均为当前时间
第二条指令因没有设date1、date2列值,第一个TIMESTAMP列date1为更新为当前时间,
而二个TIMESTAMP列date2因日期不合法而变为“00000000000000”

UPDATE test SET id= 3 WHERE id=1;
+—-+—————-+—————-+
| id | date1     | date2     |
+—-+—————-+—————-+
| 3 | 20021114094009 | 20021114093723 |
| 2 | 20021114093724 | 00000000000000 |
+—-+—————-+—————-+
->这条指令没有明确地设定date2的列值,所以第一个TIMESTAMP列date1将被更新为当前时间

UPDATE test SET id= 1,date1=date1,date2=NOW() WHERE id=3;
+—-+—————-+—————-+
| id | date1     | date2     |
+—-+—————-+—————-+
| 1 | 20021114094009 | 20021114094320 |
| 2 | 20021114093724 | 00000000000000 |
+—-+—————-+—————-+
->这条指令因设定date1=date1,所以在更新数据时date1列值并不会发生改变
而因设定date2=NOW(),所以在更新数据时date2列值会被更新为当前时间
此指令等效为 update test SET id= 1,date1=date1,date2=NULL WHERE id=3;

因MySQL返回的 TIMESTAMP 列为数字显示形式,
你可以用DATE_FROMAT()函数来格式化 TIMESTAMP 列

SELECT id,DATE_FORMAT(date1,’%Y-%m-%d %H:%i:%s’) As date1,
DATE_FORMAT(date2,’%Y-%m-%d %H:%i:%s’) As date2 FROM test;
+—-+———————+———————+
| id | date1        | date2        |
+—-+———————+———————+
| 1 | 2002-11-14 09:40:09 | 2002-11-14 09:43:20 |
| 2 | 2002-11-14 09:37:24 | 0000-00-00 00:00:00 |
+—-+———————+———————+

SELECT id,DATE_FORMAT(date1,’%Y-%m-%d’) As date1,
DATE_FORMAT(date2,’%Y-%m-%d’) As date2 FROM test;

+—-+————-+————-+
| id | date1    | date2    |
+—-+————-+————-+
| 1 | 2002-11-14 | 2002-11-14 |
| 2 | 2002-11-14 | 0000-00-00 |
+—-+————-+————-+

在某种程度上,你可以把一种日期类型的值赋给一个不同的日期类型的对象。
然而,而尤其注意的是:值有可能发生一些改变或信息的损失:

1、如果你将一个DATE值赋给一个DATETIME或TIMESTAMP对象,结果值的时间部分被设置为’00:00:00′,因为DATE值中不包含有时间信息。
2、如果你将一个DATETIME或TIMESTAMP值赋给一个DATE对象,结果值的时间部分被删除,因为DATE类型不存储时间信息。
3、尽管DATETIME, DATE和TIMESTAMP值全都可以用同样的格式集来指定,
但所有类型不都有同样的值范围。
例如,TIMESTAMP值不能比1970早,也不能比2037晚,
这意味着,一个日期例如’1968-01-01′,当作为一个DATETIME或DATE值时它是合法的,
但它不是一个正确TIMESTAMP值!并且如果将这样的一个对象赋值给TIMESTAMP列,它将被变换为0。

当指定日期值时,当心某些缺陷:

1、允许作为字符串指定值的宽松格式能被欺骗。例如,,因为“:”分隔符的使用,值’10:11:12′可能看起来像时间值,但是如果在一个日期中使用,上下文将作为年份被解释成’2010-11-12′。值’10:45:15′将被变换到’0000-00-00′,因为’45′不是一个合法的月份。

2、以2位数字指定的年值是模糊的,因为世纪是未知的。MySQL使用下列规则解释2位年值: 在00-69范围的年值被变换到2000-2069。 在范围70-99的年值被变换到1970-1999。

awk -F”[[]]”和awk -F”[][]“分割出的串为什么不一样?

0

按理说 -F”[]“,[]表示匹配括号中的任何一个字符,[]中间的字符应该是和顺序无关的,可是我实验的结果却不一样,这是为什么呢?

 

echo “1[2]3[4]” | awk -F”[\\\\[\\\\]]” ‘{print $1,$2,$3,$4}’

 

有时候用6个^做分隔符的时候,就需要采用awk -F”[\\\\^\\\\^\\\\^\\\\^\\\\^\\\\^]” ‘{print $1}’

回到顶部