VB.net 2010 视频教程 VB.net 2010 视频教程 python基础视频教程
SQL Server 2008 视频教程 c#入门经典教程 Visual Basic从门到精通视频教程
当前位置:
首页 > 编程开发 > python爬虫 >
  • 自学Python-1 week!

一、第一个程序

hello word!

print(“hello word!”)

二、变量

声明变量

name="xiaowoniu"

上述代码声明了一个变量,变量名为: name,变量name的值为:"xiaowoniu"

变量定义的规则:

    • 变量名只能是 字母、数字或下划线的任意组合
    • 变量名的第一个字符不能是数字
    • 以下关键字不能声明为变量名
      ['and', 'as', 'assert', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 'except', 'exec', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 'lambda', 'not', 'or', 'pass', 'print', 'raise', 'return', 'try', 'while', 'with', 'yield']

变量的赋值

name="xiaowoniu"

name2=name  ####name2=neme的赋值“xiaowoniu”

print=(name,neme2)

name="Liyuying"

print(name,neme2)

三、字符编码(发展)

ASCII 255 1bytes  ##最开始的编码256字节

1980 GB2312 7xxx
1995 GBK1.0 2W+
2000 GB18030 27xxx
unicode 2bytes
utf-8 en:1bytes,zh:3bytes ###Python3.0默认的编码

以下为查找资料

python解释器在加载 .py 文件中的代码时,会对内容进行编码(默认ascill)

ASCII(American Standard Code for Information Interchange,美国标准信息交换代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言,其最多只能用 8 位来表示(一个字节),即:2**8 = 256-1,所以,ASCII码最多只能表示 255 个符号。

 

关于中文

为了处理汉字,程序员设计了用于简体中文的GB2312和用于繁体中文的big5。

GB2312(1980年)一共收录了7445个字符,包括6763个汉字和682个其它符号。汉字区的内码范围高字节从B0-F7,低字节从A1-FE,占用的码位是72*94=6768。其中有5个空位是D7FA-D7FE。

GB2312 支持的汉字太少。1995年的汉字扩展规范GBK1.0收录了21886个符号,它分为汉字区和图形符号区。汉字区包括21003个字符。2000年的 GB18030是取代GBK1.0的正式国家标准。该标准收录了27484个汉字,同时还收录了藏文、蒙文、维吾尔文等主要的少数民族文字。现在的PC平台必须支持GB18030,对嵌入式产品暂不作要求。所以手机、MP3一般只支持GB2312。

从ASCII、GB2312、GBK 到GB18030,这些编码方法是向下兼容的,即同一个字符在这些方案中总是有相同的编码,后面的标准支持更多的字符。在这些编码中,英文和中文可以统一地处理。区分中文编码的方法是高字节的最高位不为0。按照程序员的称呼,GB2312、GBK到GB18030都属于双字节字符集 (DBCS)。

有的中文Windows的缺省内码还是GBK,可以通过GB18030升级包升级到GB18030。不过GB18030相对GBK增加的字符,普通人是很难用到的,通常我们还是用GBK指代中文Windows内码。

 

 

显然ASCII码无法将世界上的各种文字和符号全部表示,所以,就需要新出一种可以代表所有字符和符号的编码,即:Unicode

Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,规定虽有的字符和符号最少由 16 位来表示(2个字节),即:2 **16 = 65536,
注:此处说的的是最少2个字节,可能更多

UTF-8,是对Unicode编码的压缩和优化,他不再使用最少使用2个字节,而是将所有的字符和符号进行分类:ascii码中的内容用1个字节保存、欧洲的字符用2个字节保存,东亚的字符用3个字节保存...

所以,python解释器在加载 .py 文件中的代码时,会对内容进行编码(默认ascill),如果是如下代码的话:

报错:ascii码无法表示中文

1
2
3
#!/usr/bin/env python
 
print "你好,世界"

改正:应该显示的告诉python解释器,用什么编码来执行源代码,即:

1
2
3
4
#!/usr/bin/env python
# -*- coding: utf-8 -*-
 
print "你好,世界"

四、判断语句和用户输入

# Author:linhui liu
import getpass ###引入模块为密码加密
_username="llh"
_passwd="123456"
username=input("username:")
#passwd=getpass.getpass("passwd:")
passwd=input("pawsswd:")
if _username==username and _passwd==passwd:
    print("Wlecome user {name} login...".format(name=username))
else:
    print("用户名或密码错误!")

五、模块初识

Python的强大之处在于他有非常丰富和强大的标准库和第三方库,几乎你想实现的任何功能都有相应的Python库支持。

随笔:

sys 模块作用:打印环境变量。
os模块作用:
os.system(“dir”)#执行命令,不保存结果。
os.popen(“dir”).read()
0成功,非0执行命令失败。

# Author:linhui liu
import sys
import os
#print(sys.path)#打印环境变量
#print(sys.argv)打印绝对路径
#print(sys.argv[2])

#cmd_res=os.system("dir")#执行命令不保存结果
cmd_res=os.popen("dir").read()
print("---->",cmd_res)
os.mkdir("new_dir")#当前目录下建立新的目录
六、相互作用
# Author:linhui liu
name=input("name:")
age=input("age:")
print(type(age),type(int(age)))
job=input("job:")
salary=input("salary:")

info='''
-----info of %s-----
Name:%s
Age:%s
Job:%s
Salary:%s
''' %(name,name,age,job,salary)
info2='''
-----info of {_name}--------
Name:{_name}
Age:{_age}
Job:{_job}
Salary:{_salary}
''' .format(__name=name,
            __age=age,
            __job=job,
            __salary=salary)
info3='''
-----------info of {0}-------
Name:{0}
Age:{1}
Job:{2}
Salary:{3}
'''.format(name,age,job,salary)
print(info3)
七、使用所学写的小小的游戏
# Author:linhui liu
age_of_liyuying="56"
count=0
while count<3:
    guess_age=input("guess age:")
    if guess_age==age_of_liyuying:
        print("恭喜你,答对了!")
        break
    elif guess_age>age_of_liyuying:
        print("请往小里猜!")
    else:
        print("请往大里猜!")
    count+=1
    if count==3:
        countine_confirm=input("是否继续尝试?")
        if countine_confirm!="n":
            count=0
else:
    print("你尝试了太多次,笨蛋!")
八、数据类型

int(整形)long(长整形)float(浮点数)
type()#查看数据类型

九、二进制和编码转换

msg=李玉英
print(msg)
print(msg.encode(edcodong="utf-8"))#utf-8转换成二进制
print(msg.encode(edcodong="utf-8").decode(edcodong="utf-8"))#二进制转换成utf-8

十、替换、删除、排序等语法

names.append("123")#插入后面。
names.insert(1,"123")#插入到第二个位置
names[2]="123"#替换
names.remove("123")#删除
names.reverse()#反转
names.sort()#排序
names.extend()#并到names列表里
del names[2]#删除第3个
print(names[1:3])#切片顾头不顾尾
print(names[-3:-1])#取后面的值,数字从右往左数。
for i in (names)
print(i)#for循环

 

出处:https://www.cnblogs.com/liulinhui/p/13620407.html

 


相关教程