日志

源代码（Source code），

已有 2158 次阅读 2014-3-11 08:57 |关键词:计算机语言 blank 微软雅黑源代码 normal

源代码（一系列人类可读的计算机语言指令）http://baike.baidu.com/subview/60376/5122159.htm#

源程序是指未编译的按照一定的程序设计语言规范书写的文本文件。源代码（也称源程序），是指一系列人类可读的计算机语言指令。在现代程序语言中，源代码可以是以书籍或者磁带的形式出现，但最为常用的格式是文本文件，这种典型格式的目的是为了编译出计算机程序。计算机源代码的最终目的是将人类可读的文本翻译成为计算机可以执行的二进制指令，这种过程叫做编译，通过编译器完成。

1作用说明

源代码主要功用有如下2种作用：

生成目标代码，即计算机可以识别的代码。

对软件进行说明，即对软件的编写进行说明。为数不少的初学者，甚至少数有经验的程序员都忽视软件说明的编写，因为这部分不会在生成的程序中直接显示，也不参与编译。但是注释代码对软件的学习、分享、维护和软件复用都有巨大的好处。因此，书写软件说明在业界被认为是能创造优秀程序的良好习惯，一些公司也硬性规定必须书写。

需要指出的是，源代码的修改不能改变已经生成的目标代码。如果需要目标代码做出相应的修改，必须重新编译。

2版权分类

如果按照源代码类型区分软件，通常被分为两类：自由软件和非自由软件。自由软件一般是不仅可以免费得到，而且公开源代码；相对应地，非自由软件则是不公开源代码。所有一切通过非正常手段获得非自由软件源代码的行为都将被视为非法。

3质量标准

对于计算机而言，并不存在真正意义上的“好”的源代码；然而作为一个人，好的书写习惯将决定源代码的好坏。源代码是否具有可读性，成为好坏的重要标准。软件文档则是表明可读性的关键。

4执行效率

虽然我们可以通过不同的语言来实现计算机的同一功能，但在执行效率上则存在不同。普遍规律是：越高级的语言，其执行效率越低。这也是为什么汇编语言生成的文件比用VB语言生成文件普遍要小的原因。

源代码就是用汇编语言和高级语言写出来的代码。主要对象是面向开发者；

我们平常使用的应用程序都是经过源码编译打包以后发布的，呈现的最后结果是面向使用者，最终客户的。

5概念研究

理论上的概念

源代码是相对目标代码和可执行代码而言的。

源代码就是用汇编语言和高级语言写出来的代码。

目标代码是指源代码经过编译程序产生的能被cpu直接识别的二进制代码。

可执行代码就是将目标代码连接后形成的可执行文件，当然也是二进制的。

最直观的概念

在这个网页上右键鼠标，选择"查看源文件".出来一个记事本,里面的内容就是此网页的源代码.

关于两者的区别联系：

1．从字面意义上来讲，源文件是指一个文件,指源代码的集合。源代码则是一组具有特定意义的可以实现特定功能的字符(程序开发代码).

2．"源代码"在大多数时候等于"源文件".

比如在这个网页上右键鼠标，选择查看源文件。出来一个记事本,里面的内容就是此网页的源代码."这句话就体现了他们的关系，此处的源文件是指网页的源文件,而源代码就是源文件的内容，所以又可以称做网页的源代码。.

源代码是指原始代码，可以是任何语言代码。

汇编码是指源代码编译后的代码，通常为二进制文件，比如DLL、EXE、.NET中间代码、JAVA中间代码等。

高级语言通常指C/C++、

汇编语言就是ASM，只有这个，比这个更低级的就是机器语言了。

源程序源文件源代码是一回事。

Source code http://en.wikipedia.org/wiki/Source_code

In computing, source code is any collection of computer instructions (possibly with comments) written using some human-readable computer language, usually as text. The source code of a program is specially designed to facilitate the work of computer programmers, who specify the actions to be performed by a computer mostly by writing source code. The source code is often transformed by a compiler program into low-level machine code understood by the computer. The machine code might then be stored for execution at a later time. Alternatively, aninterpreter can be used to analyze and perform the outcomes of the source code program directly on the fly.

Most computer applications are distributed in a form that includes executable files, but not their source code. If the source code were included, it would be useful to a user, programmer, or system administrator, who may wish to modify the program or understand how it works.

Aside from its machine-readable forms, source code also appears in books and other media; often in the form of small code snippets, but occasionally complete code bases; a well-known case is the source code of PGP.

Definitions

The notion of source code may also be taken more broadly, to include machine code and notations in graphical languages, neither of which are textual in nature. An example from an article presented on the annual IEEE conference on Source Code Analysis and Manipulation:[1]

For the purpose of clarity ‘source code’ is taken to mean any fully executable description of a software system. It is therefore so construed as to include machine code, very high level languages and executable graphical representations of systems.[2]

Organization

The source code which constitutes a program is usually held in one or more text files stored on a computer's hard disk; usually these files are carefully arranged into a directory tree, known as a source tree. Source code can also be stored in a database (as is common for stored procedures) or elsewhere.

The source code for a particular piece of software may be contained in a single file or many files. Though the practice is uncommon, a program's source code can be written in different programming languages.[3] For example, a program written primarily in the C programming language, might have portions written in assembly language for optimization purposes. It is also possible for some components of a piece of software to be written and compiled separately, in an arbitrary programming language, and later integrated into the software using a technique called library linking. This is the case in some languages, such as Java: each class is compiled separately into a file and linked by the interpreter at runtime.

Yet another method is to make the main program an interpreter for a programming language[citation needed], either designed specifically for the application in question or general-purpose, and then write the bulk of the actual user functionality as macros or other forms of add-ins in this language, an approach taken for example by the GNU Emacs text editor.

The code base of a computer programming project is the larger collection of all the source code of all the computer programs which make up the project. It has become common practice to maintain code bases in version control systems. Moderately complex software customarily requires the compilation or assembly of several, sometimes dozens or even hundreds, of different source code files. In these cases, instructions for compilations, such as a Makefile, are included with the source code. These describe the relationships among the source code files, and contain information about how they are to be compiled.

The revision control system is another tool frequently used by developers for source code maintenance.

Purposes[edit]

Source code is primarily used as input to the process that produces an executable program (i.e., it is compiled or interpreted). It is also used as a method of communicating algorithms between people (e.g., code snippets in books).[4]

Programmers often find it helpful to review existing source code to learn about programming techniques.[4] The sharing of source code between developers is frequently cited as a contributing factor to the maturation of their programming skills.[4] Some people consider source code an expressive artistic medium.[5]

Porting software to other computer platforms is usually prohibitively difficult without source code. Without the source code for a particular piece of software, portability is generally computationally expensive.[citation needed]Possible porting options include binary translation and emulation of the original platform.

Decompilation of an executable program can be used to generate source code, either in assembly code or in a high-level language.

Programmers frequently adapt source code from one piece of software to use in other projects, a concept known as software reusability.

Licensing

Main article: Software license

Software, and its accompanying source code, typically falls within one of two licensing paradigms: open source and proprietary software.

Generally speaking, software is open source if the source code is free to use, distribute, modify and study, and proprietary if the source code is kept secret, or is privately owned and restricted. The first software license to be published and to explicitly grant these freedoms was the GNU General Public License in 1989. The GNU GPL was originally intended to be used with the GNU operating system.

For proprietary software, the provisions of the various copyright laws, trade secrecy and patents are used to keep the source code closed. Additionally, many pieces of retail software come with an end-user license agreement (EULA) which typically prohibits decompilation, reverse engineering, analysis, modification, or circumventing of copy protection. Types of source code protection – beyond traditional compilation to object code – include code encryption,code obfuscation or code morphing.

Legal issues in the United States

One of the first court cases regarding the nature of source code as free speech involved University of California mathematics professor Dan Bernstein, who had published on the Internet the source code for an encryption program that he created. At the time, encryption algorithms were classified as munitions by the United States government; exporting encryption to other countries was considered an issue of national security, and had to be approved by the State Department. The Electronic Frontier Foundation sued the U.S. government on Bernstein's behalf; the court ruled that source code was free speech, protected by the First Amendment.In a 2003 court case in the United States, it was ruled that source code should be considered a constitutionally protected form of free speech. Proponents of free speech argued that because source code conveys information to programmers, is written in a language, and can be used to share humour and other artistic pursuits, it is a protected form of communication.

Quality[edit]

Main article: Software quality

The way a program is written can have important consequences for its maintainers. Coding conventions, which stress readability and some language-specific conventions, are aimed at the maintenance of the software source code, which involves debugging and updating. Other priorities, such as the speed of the program's execution, or the ability to compile the program for multiple architectures, often make code readability a less important consideration, since codequality generally depends on its purpose.

See also[edit]

References[edit]

Jump up^ SCAM Working Conference, 2001–2010.
Jump up^ Why Source Code Analysis and Manipulation Will Always Be Important by Mark Harman, 10th IEEE International Working Conference on Source Code Analysis and Manipulation (SCAM 2010). Timişoara, Romania, 12–13 September 2010.
Jump up^ Extending and Embedding the Python Interpreter — Python v2.6 Documentation [1]
^ Jump up to:a b c Spinellis, D: Code Reading: The Open Source Perspective. Addison-Wesley Professional, 2003. ISBN 0-201-79940-5
Jump up^ "Art and Computer Programming" ONLamp.com, (2005)

(VEW04) "Using a Decompiler for Real-World Source Recovery", M. Van Emmerik and T. Waddington, the Working Conference on Reverse Engineering, Delft, Netherlands, 9–12 November 2004. Extended version of the paper.

External links[edit]

Look up code or source code in Wiktionary, the free dictionary.

Wikimedia Commons has media related to Source code.

Source Code Definition by The Linux Information Project (LINFO)
"Obligatory accreditation system for IT security products (2008-09-22), may start from May 2009, reported by Yomiuri on 2009-04-24.". MetaFilter.com. Retrieved 2009-04-24.
Same program written in multiple languages

源代码 http://zh.wikipedia.org/wiki/源代码

源代码（英语：Source code），也称源程序，是指一系列人类可读的计算机语言指令。

在现代程序语言中，源代码可以是以书籍或者磁带的形式出现，但最为常用的格式是文本文件，这种典型格式的目的是为了编译出计算机程序。计算机源代码的最终目的是将人类可读的文本翻译成为计算机可以执行的二进制指令，这种过程叫做编译，通过编译器完成。

作用

源代码主要功用有如下2种作用：

生成目标代码，即计算机可以识别的代码。
对软件进行说明，即对软件的编写进行说明。为数不少的初学者，甚至少数有经验的程序员都忽视软件说明的编写，因为这部分虽然不会在生成的程序中直接显示，也不参与编译。但是说明对软件的学习、分享、维护和软件复用都有巨大的好处。因此，书写软件说明在业界被认为是能创造优秀程序的良好习惯，一些公司也硬性规定必须书写。

需要指出的是，对于编译语言来说，例如C/C++/Java，源代码的修改不能改变已经生成的目标代码。如果需要目标代码做出相应的修改，必须重新编译。但是目前有许多流行的脚本语言，例如Perl/Python都不需要重新编译，修改完代码可以直接执行看到修改的结果。

代码组合

源代码作为软件的特殊部分，可能被包含在一个或多个文件中。一个程序不必用同一种格式的源代码书写。例如，一个程序如果有C语言库的支持，那么就可以用C语言；而另一部分为了达到比较高的运行效率，则可以用汇编语言编写。就目前的情况而言，很少有需要直接用汇编语言来编写的软件了，因为很多时候编译器生成的优化程序的运行效率已经很好了，更多的时候是用C/C++/Java这样的编译语言来写核心需要速度的部分，用Perl/Python/Lua等这样的动态语言来做核心的扩展，例如界面，管理配置等等。这样既不会损失效率，也增加了程序的灵活性。

较为复杂的软件，一般需要数十种甚至上百种的源代码的参与。为了降低种复杂度，必须引入一种可以描述各个源代码之间联系，并且如何正确编译的系统。在这样的背景下，版本控制系统（VCS）诞生了，并成为研发者对代码修订的必备工具之一。

还有另外一种组合：将为一种平台编写的软件移植到另外一种平台上，例如将Windows下的软件移植到Linux或者MacOS下，专业术语叫做软件移植。一般可以运行在多个平台下的软件叫做跨平台软件。

版权

如果按照源代码类型区分软件，通常被分为两类：自由软件和专有软件。通常，自由软件不仅可以免费得到，而且公开源代码；相对应地，非自由软件则不公开源代码。通过非正常手段获得非自由软件源代码的各种行为都将被视为非法。

质量／质量

对于计算机而言，并不存在真正意义上的“好”的源代码；好的源程序，首先要是正确的代码。然后是源程序的可维护性，好的程序风格将可以增强代码的可维护性。源代码是否具有可读性，成为代码质量／质量的标准之一。也有人将程序的效率放在可维护性之前。根据程序所要实现的功能和应用领域很多人对源代码质量／质量有着不同的看法。但是普遍达成一致的是质量／质量高的源程序就是正确的程序。

效率

虽然我们可以通过不同的语言来实现计算机的同一功能，但在执行效率上则存在不同。普遍规律是：越高级的语言，其执行效率越低。这也是为什么汇编语言生成的文件比用VB语言生成文件普遍要小的原因。然而，使用低级语言虽可提高运行效率，却会大大降低程序的开发效率，可能导致开发工作变得非常困难，因此一些程序员并不在意高级语言带来的运行效率损失，

目前，许多程序主要使用高级语言来开发，对于要求执行效率的部分使用低级语言编写，以达到开发效率与运行效率的折中。

源代码 http://www.baike.com/wiki/源代码

源代码（也称源程序），是指一系列人类可读的计算机语言指令。

源代码 - 作用说明

　　源代码主要功用有如下2种作用：
　　生成目标代码，即计算机可以识别的代码。
　　对软件进行说明，即对软件的编写进行说明。为数不少的初学者，甚至少数有经验的程序员都忽视软件说明的编写，因为这部分虽然不会在生成的程序中直接显示，也不参与编译。但是说明对软件的学习、分享、维护和软件复用都有巨大的好处。因此，书写软件说明在业界被认为是能创造优秀程序的良好习惯，一些公司也硬性规定必须书写。
　　需要指出的是，源代码的修改不能改变已经生成的目标代码。如果需要目标代码做出相应的修改，必须重新编译。

源代码 - 代码组合

　　源代码作为软件的特殊部分，可能被包含在一个或多个文件中。一个程序不必用同一种格式的源代码书写。例如，一个程序如果有C语言库的支持，那么就可以用C语言；而另一部分为了达到比较高的运行效率，则可以用汇编语言编写。
　　较为复杂的软件，一般需要数十种甚至上百种的源代码的参与。为了降低种复杂度，必须引入一种可以描述各个源代码之间联系，并且如何正确编译的系统。在这样的背景下，修订控制系统（RCS）诞生了，并成为研发者对代码修订的必备工具之一。
　　还有另外一种组合：源代码的编写和编译分别在不同的平台上实现，专业术语叫做软件移植。

源代码 - 版权分类

源代码 - 质量标准

源代码 - 执行效率

　　虽然我们可以通过不同的语言来实现计算机的同一功能，但在执行效率上则存在不同。普遍规律是：越高级的语言，其执行效率越低。这也是为什么汇编语言生成的文件比用VB语言生成文件普遍要小的原因。
　　源代码就是用汇编语言和高级语言写出来的代码。主要对象是面向开发者；
　　我们平常使用的应用程序都是经过源码编译打包以后发布的，呈现的最后结果是面向使用者，最终客户的。

源代码 - 概念研究

　　1.理论上的概念
　　源代码是相对目标代码和可执行代码而言的。
　　源代码就是用汇编语言和高级语言写出来的代码。
　　目标代码是指源代码经过编译程序产生的能被cpu直接识别二进制代码。
　　可执行代码就是将目标代码连接后形成的可执行文件，当然也是二进制的。
　　2.最直观的概念
　　在这个网页上右键鼠标,选择"查看源文件".出来一个记事本,里面的内容就是此网页的源代码. ===================================================
　　关于两者的区别联系:
　　1.从字面意义上来讲,源文件是指一个文件,指源代码的集合.源代码则是一组具有特定意义的可以实现特定功能的字符(程序开发代码).
　　2."源代码"在大多数时候等于"源文件".
　　比如在这个网页上右键鼠标,选择查看源文件.出来一个记事本,里面的内容就是此网页的源代码."这句话就体现了他们的关系,此处的源文件是指网页的源文件,而源代码就是源文件的内容,所以又可以称做网页的源代码..
　　=================================================== 源代码是指原始代码，可以是任何语言代码。
　　汇编码是指源代码编译后的代码，通常为二进制文件，比如DLL、EXE、.NET中间代码、JAVA中间代码等。
　　高级语言通常指C/C++ 、 BASIC、C# 、JAVA、PASCAL 等等　　汇编语言就是ASM，只有这个，比这个更低级的就是机器语言了。
　　源程序源文件源代码是一回事。

源代码 - 程序使用

　　引源程序一般就是可以用记事本打开的好多行英文的，用编程语言写好的软件
　　源程序经过编译成目标程序，才能运行。一般目标程序不能再修改了。
　　我们电脑上安装的软件都是目标程序。源程序不可能直接运行的。
　　提倡软件开源的人士认为应该提供源程序给用户，让用户自己修改，有利于软件行业的发展。反对的人觉得这样不利于保护版权。
　　你如果不懂编程，源程序可以不管它。不影响正常使用。
　　引源代码作为软件的特殊部分，可能被包含在一个或多个文件中。一个程序不必用同一种格式的源代码书写。例如，一个程序如果有C语言库的支持，那么就可以用C语言；而另一部分为了达到比较高的运行效率，则可以用汇编语言编写。
　　较为复杂的软件，一般需要数十种甚至上百种的源代码的参与。为了降低种复杂度，必须引入一种可以描述各个源代码之间联系，并且如何正确编译的系统。在这样的背景下，修订控制系统（RCS）诞生了，并成为研发者对代码修订的必备工具之一。
　　还有另外一种组合：源代码的编写和编译分别在不同的平台上实现，专业术语叫做软件移植。

编译 http://baike.baidu.com/view/69568.htm

编译(compilation , compile) 1、利用编译程序从源语言编写的源程序产生目标程序的过程。 2、用编译程序产生目标程序的动作。编译就是把高级语言变成计算机可以识别的2进制语言，计算机只认识1和0，编译程序把人们熟悉的语言换成2进制的。编译程序把一个源程序翻译成目标程序的工作过程分为五个阶段：词法分析；语法分析；语义检查和中间代码生成；代码优化；目标代码生成。主要是进行词法分析和语法分析，又称为源程序分析，分析过程中发现有语法错误，给出提示信息。

1词法分析

词法分析的任务是对由字符组成的单词进行处理，从左至右逐个字符地对源程序进行扫描，产生一个个的单词符号，把作为字符串的源程序改造成为单词符号串的中间程序。执行词法分析的程序称为词法分析程序或扫描器。

源程序中的单词符号经扫描器分析，一般产生二元式：单词种别；单词自身的值。单词种别通常用整数编码，如果一个种别只含一个单词符号，那么对这个单词符号，种别编码就完全代表它自身的值了。若一个种别含有许多个单词符号，那么，对于它的每个单词符号，除了给出种别编码以外，还应给出自身的值。

词法分析器一般来说有两种方法构造：手工构造和自动生成。手工构造可使用状态图进行工作，自动生成使用确定的有限自动机来实现。[1]

2语法分析

编译程序的语法分析器以单词符号作为输入，分析单词符号串是否形成符合语法规则的语法单位，如表达式、赋值、循环等，最后看是否构成一个符合要求的程序，按该语言使用的语法规则分析检查每条语句是否有正确的逻辑结构，程序是最终的一个语法单位。编译程序的语法规则可用上下文无关文法来刻画。

语法分析的方法分为两种：自上而下分析法和自下而上分析法。自上而下就是从文法的开始符号出发，向下推导，推出句子。而自下而上分析法采用的是移进归约法，基本思想是：用一个寄存符号的先进后出栈，把输入符号一个一个地移进栈里，当栈顶形成某个产生式的一个候选式时，即把栈顶的这一部分归约成该产生式的左邻符号。

3中间代码

中间代码是源程序的一种内部表示，或称中间语言。中间代码的作用是可使编译程序的结构在逻辑上更为简单明确，特别是可使目标代码的优化比较容易实现中间代码，即为中间语言程序，中间语言的复杂性介于源程序语言和机器语言之间。中间语言有多种形式，常见的有逆波兰记号、四元式、三元式和树。

4代码优化

代码优化是指对程序进行多种等价变换，使得从变换后的程序出发，能生成更有效的目标代码。所谓等价，是指不改变程序的运行结果。所谓有效，主要指目标代码运行时间较短，以及占用的存储空间较小。这种变换称为优化。

有两类优化：一类是对语法分析后的中间代码进行优化，它不依赖于具体的计算机；另一类是在生成目标代码时进行的，它在很大程度上依赖于具体的计算机。对于前一类优化，根据它所涉及的程序范围可分为局部优化、循环优化和全局优化三个不同的级别。

5目标代码

目标代码生成是编译的最后一个阶段。目标代码生成器把语法分析后或优化后的中间代码变换成目标代码。目标代码有三种形式：

① 可以立即执行的机器语言代码，所有地址都重定位；

② 待装配的机器语言模块，当需要执行时，由连接装入程序把它们和某些运行程序连接起来，转换成能执行的机器语言代码；

③ 汇编语言代码，须经过汇编程序汇编后，成为可执行的机器语言代码。

目标代码生成阶段应考虑直接影响到目标代码速度的三个问题：一是如何生成较短的目标代码；二是如何充分利用计算机中的寄存器，减少目标代码访问存储单元的次数；三是如何充分利用计算机指令系统的特点，以提高目标代码的质量。

6表格管理

编译过程中源程序的各种信息被保留在种种不同的表格，编译各阶段的工作都涉及到构造、查找、或更新有关的表格。

7出错处理

如果编译过程中发现源程序有错误，编译程序应报告错误的性质和错误的发生的地点，并且将错误所造成的影响限制在尽可能小的范围内，使得源程序的其余部分能继续被编译下去，有些编译程序还能自动纠正错误，这些工作由错误处理程序完成。

需要注意的是，一般上编译器只做语法检查和最简单的语义检查，而不检查程序的逻辑。

http://zh.wikipedia.org/zh-cn/汇编语言

汇编语言（英语：Assembly language）是一种用于电子计算机、微处理器、单片机或其他可编程器件的低级语言，在不同的设备中，汇编语言对应着不同的机器语言指令集。一种汇编语言专用于某种计算机系统结构，而不像许多高级语言，可以在不同系统平台之间移植。

使用汇编语言编写的源代码，需要通过使用相应的汇编程序将它们转换成可执行的机器代码。这一过程被称为汇编过程。

汇编语言采用了助记符（mnemonics）来代表特定低级机器语言的操作。特定的汇编目标指令集可能会包括特定的操作数。许多汇编程序可以识别代表地址和常量的标签（label）和符号（symbols），这样就可以用字符来代表操作数而无需采取写死的方式。普遍地说，特定的汇编语言和特定的机器语言指令集是一一对应的。

许多汇编程序为程序开发、汇编控制、辅助调试提供了额外的支持机制。有的汇编语言编程工具经常会提供宏，它们也被称为宏汇编器。

汇编语言不像其他大多数的程序设计语言一样被广泛用于程序设计；在今天的实际应用中，它通常被应用在底层硬件操作和高要求的程序优化的场合。驱动程序、嵌入式操作系统和实时运行程序都需要汇编语言。

Motorola MC6800 汇编语言

典型的现代汇编器（Assembler）建造目标代码，由解译组语指令集的易记码（mnemonics）到操作码（OpCode），并解析符号名称（symbolic names）成为存储器地址以及其它的实体。使用符号参考是汇编器的一个重要特征，它可以节省修改程序后人工转址的乏味耗时计算。基本就是把机器码变成一些字母而已，编译的时候再把输入的指令字母替换成为晦涩难懂机器码。

现状

随着现代软件系统越来越庞大复杂，大量经过了封装的高级语言如C/C++，Pascal/Object Pascal也应运而生。这些新的语言使得程序员在开发过程中能够更简单，更有效率，使软件开发人员得以应付快速的软件开发的要求。而汇编语言由于其复杂性使得其适用领域逐步减小。但这并不意味着汇编已无用武之地。由于汇编更接近机器语言，能够直接对硬件进行操作，生成的程序与其他的语言相比具有更高的运行速度，占用更小的内存，因此在一些对于时效性要求很高的程序、许多大型程序的核心模块以及工业控制方面大量应用。

此外，虽然有众多编程语言可供选择，但汇编依然是各大学计算机科学类专业学生的必修课，以让学生深入了解计算机的运行原理。

http://www.baike.com/wiki/汇编语言

汇编语言(AssemblyLanguage)是面向机器的程序设计语言。汇编语言是一种功能很强的程序设计语言，也是利用计算机所有硬件特性并能直接控制硬件的语言。汇编语言，作为一门语言，对应于高级语言的编译器，需要一个“汇编器”来把汇编语言原文件汇编成机器可执行的代码。高级的汇编器如MASM，TASM等等为我们写汇编程序提供了很多类似于高级语言的特征，比如结构化、抽象等。在这样的环境中编写的汇编程序，有很大一部分是面向汇编器的伪指令，已经类同于高级语言。现在的汇编环境已经如此高级，即使全部用汇编语言来编写windows的应用程序也是可行的，但这不是汇编语言的长处。汇编语言的长处在于编写高效且需要对机器硬件精确控制的程序。[1]

汇编语言 - 简述

汇编语言

符号语言

在汇编语言中，用助记符(Memoni)代替操作码，用地址符号(Symbol)或标号(Label)代替地址码。这样用符号代替机器语言的二进制码，就把机器语言变成了汇编语言。因此汇编语言亦称为符号语言。

汇编

使用汇编语言编写的程序，机器不能直接识别，要由一种程序将汇编语言翻译成机器语言，这种起翻译作用的程序叫汇编程序，汇编程序是系统软件中语言处理系统软件。汇编语言编译器把汇编程序翻译成机器语言的过程称为汇编。

不能通用

汇编语言比机器语言易于读写、调试和修改，同时具有机器语言全部优点。但在编写复杂程序时，相对高级语言代码量较大，而且汇编语言依赖于具体的处理器体系结构，不能通用，因此不能直接在不同处理器体系结构之间移植。

汇编语言 - 特点

1.面向机器的低级语言，通常是为特定的计算机或系列计算机专门设计的。

2.保持了机器语言的优点，具有直接和简捷的特点。

3.可有效地访问、控制计算机的各种硬件设备，如磁盘、存储器、CPU、I/O端口等。

4.目标代码简短，占用内存少，执行速度快，是高效的程序设计语言。

5.经常与高级语言配合使用，应用十分广泛。

6.对于不同型号的计算机，有着不同的结构的汇编语言。

7.汇编语言由于采用了助记符号来编写程序，比用机器语言的二进制代码编程要方便些，在一定程度上简化了编程过程。

8.汇编语言的特点是用符号代替了机器指令代码，而且助记符与指令代码一一对应，基本保留了机器语言的灵活性。使用汇编语言能面向机器并较好地发挥机器的特性，得到质量较高的程序。

9.汇编语言是面向具体机型的，它离不开具体计算机的指令系统，因此，对于不同型号的计算机，有着不同的结构的汇编语言，而且，对于同一问题所编制的汇编语言程序在不同种类的计算机间是互不相通的。

10.汇编语言中由于使用了助记符号，用汇编语言编制的程序输入计算机，计算机不能象用机器语言编写的程序一样直接识别和执行，必须通过预先放入计算机的"汇编程序"中进行加工和翻译，才能变成能够被计算机直接识别和处理的二进制代码程序。

11.用汇编语言等非机器语言书写好的符号程序称为源程序，运行时汇编程序要将源程序翻译成目标程序。目标程序是机器语言程序，当它被安置在内存的预定位置上，就能被计算机的CPU处理和执行。[2]

汇编语言 - 优点与缺点

优点

汇编语言直接同计算机的底层软件甚至硬件进行交互，它具有如下一些优点：

（1）能够直接访问与硬件相关的存储器或I/O端口；

（2）能够不受编译器的限制，对生成的二进制代码进行完全的控制；

（3）能够对关键代码进行更准确的控制，避免因线程共同访问或者硬件设备共享引起的死锁；

（4）能够根据特定的应用对代码做最佳的优化，提高运行速度；

（5）能够最大限度地发挥硬件的功能。

（6）汇编语言用来编制系统软件和过程控制软件，其目标程序占用内存空间少，运行速度快，有着高级语言不可替代的用途。

缺点

同时还应该认识到，汇编语言是一种层次非常低的语言，它仅仅高于直接手工编写二进制的机器指令码，因此不可避免地存在一些缺点：

（1）编写的代码非常难懂，不好维护；

（2）很容易产生bug，难于调试；

（3）只能针对特定的体系结构和处理器进行优化；

（4）开发效率很低，时间长且单调。

（5）汇编语言像机器指令一样，是硬件操作的控制信息，因而仍然是面向机器的语言，使用起来还是比较繁琐费时，通用性也差。

汇编语言 - 应用

编写

70%以上的系统软件是用汇编语言编写的。某些快速处理、位处理、访问硬件设备等高效程序是用汇编语言编写的。某些高级绘图程序、视频游戏程序是用汇编语言编写的。

最有效途径

汇编语言是我们理解整个计算机系统的最佳起点和最有效途径。人们经常认为汇编语言的应用范围很小，而忽视它的重要性。其实汇编语言对每一个希望学习计算机科学与技术的人来说都是非常重要的，是不能不学习的语言。所有可编程计算机都向人们提供机器指令，通过机器指令人们能够使用机器的逻辑功能。所有程序，不论用何种语言编制，都必须转成机器指令，运用机器的逻辑功能，其功能才能得以实现。机器的逻辑功能，软件系统功能构筑其上，硬件系统功能运行于下。汇编语言直接描述机器指令，比机器指令容易记忆和理解。通过学习和使用汇编语言，能够感知、体会、理解机器的逻辑功能，向上为理解各种软件系统的原理，打下技术理论基础；向下为掌握硬件系统的原理，打下实践应用基础。学习汇编语言，向上可以理解软件，向下能够感知硬件，是我们理解整个计算机系统的最佳起点和最有效途径。

汇编语言 - Linux 汇编语言

汇编代码

作为最基本的编程语言之一，汇编语言虽然应用的范围不算很广，但重要性却勿庸置疑，因为它能够完成许多其它语言所无法完成的功能。就拿 Linux 内核来讲，虽然绝大部分代码是用 C 语言编写的，但仍然不可避免地在某些关键地方使用了汇编代码，其中主要是在 Linux 的启动部分。由于这部分代码与硬件的关系非常密切，即使是 C 语言也会有些力不从心，而汇编语言则能够很好扬长避短，最大限度地发挥硬件的性能。

Linux 程序员

大多数情况下 Linux 程序员不需要使用汇编语言，因为即便是硬件驱动这样的底层程序在 Linux 操作系统中也可以用完全用 C 语言来实现，再加上 GCC 这一优秀的编译器目前已经能够对最终生成的代码进行很好的优化，的确有足够的理由让我们可以暂时将汇编语言抛在一边了。但实现情况是 Linux 程序员有时还是需要使用汇编，或者不得不使用汇编，理由很简单：精简、高效和 libc 无关性。假设要移植 Linux 到某一特定的嵌入式硬件环境下，首先必然面临如何减少系统大小、提高执行效率等问题，此时或许只有汇编语言能帮上忙了。

优点

汇编语言直接同计算机的底层软件甚至硬件进行交互，它具有如下一些优点：
•能够直接访问与硬件相关的存储器或 I/O 端口；
•能够不受编译器的限制，对生成的二进制代码进行完全的控制；
•能够对关键代码进行更准确的控制，避免因线程共同访问或者硬件设备共享引起的死锁；
•能够根据特定的应用对代码做最佳的优化，提高运行速度；
•能够最大限度地发挥硬件的功能。

缺点

同时还应该认识到，汇编语言是一种层次非常低的语言，它仅仅高于直接手工编写二进制的机器指令码，因此不可避免地存在一些缺点：
•编写的代码非常难懂，不好维护；
•很容易产生 bug，难于调试；
•只能针对特定的体系结构和处理器进行优化；
•开发效率很低，时间长且单调。

两种不同的形式

Linux 下用汇编语言编写的代码具有两种不同的形式。第一种是完全的汇编代码，指的是整个程序全部用汇编语言编写。尽管是完全的汇编代码，Linux 平台下的汇编工具也吸收了 C 语言的长处，使得程序员可以使用 #include、#ifdef 等预处理指令，并能够通过宏定义来简化代码。第二种是内嵌的汇编代码，指的是可以嵌入到C语言程序中的汇编代码片段。虽然 ANSI 的 C 语言标准中没有关于内嵌汇编代码的相应规定，但各种实际使用的 C 编译器都做了这方面的扩充，这其中当然就包括 Linux 平台下的 GCC。[3]

http://www.baike.com/wiki/反汇编

　　反汇编：把目标代码转为汇编代码的过程，也可以说是把编程语言转换为汇编语言代码、低级转高级的意思，常用于软件破解（例如找到它是如何注册的，从而解出它的注册码或者编写注册机）、外挂技术、病毒分析、逆向工程、软件汉化等领域。学习和理解反汇编语言对软件调试、漏洞分析、OS的内核原理及理解高级语言代码都有相当大的帮助，在此过程中我们可以领悟到软件作者的编程思想。总之一句话：软件一切神秘的运行机制全在反汇编代码里面。原理　　通常，编写程序是利用高级语言如C，pascal等高级语言进行编程的，然后再经过编译程序生成可以被计算机系统直接执行的文件（机器语言）。反汇编即是指将这些执行文件反编译还原成汇编语言或其他高级语言。但通常反编译出来的程序与原程序会存在些许不同，虽然执行效果相同，但程序代码会发生很大的变化，要读懂反汇编需要有扎实的高级语言编写功底和汇编功底。

反汇编 - 反汇编作用及方式

作用　　有许多程序可以进行逆向操作即反编译以求修改，例如 Flash的文件生成的SWF文件，可以被反汇编成Flash原码，但可以发现与原程序代码发生了很大变化。
　　目前网络上的许多“免费软件”，PSP PS NDS游戏机的破解和苹果iOS系统的越狱都跟反汇编息息相关。静态反汇编　　静态反汇编是从反汇编出来的程序清单上分析，从提示信息入手进行分析。目前，大多数软件在设计时，都采用了人机对话方式。所谓人机对话，即在软件运行过程中，需要由用户选择的地方，软件即显示相应的提示信息，并等待用户按键选择。而在执行完某一段程序之后，便显示一串提示信息，以反映该段程序运行后的状态，是正常运行，还是出现错误，或者提示用户进行下一步工作的帮助信息。为此，如果我们对静态反汇编出来的程序清单进行阅读，可了解软件的编程思路，以便顺利破解该软件，也就是我们常说的破解版即盗版。反汇编亦是外挂设计最重要的环节，可以说没有反汇编就没有外挂。常用的静态分析工具是 W32DASM、 PEiD、FileInfo、 Hex Rays Ida和HIEW等。

反汇编 - 反汇编工具

　　反汇编工具如： OD、 IDA Pro、 DEBUG、等。
　　反汇编可以通过反汇编的一些软件实现，比如DEBUG就能实现反汇编，当DEBUG文件位置设置为-u时，即可实现反汇编。而使用OD实现反汇编时，杀毒软件可能会报告有病毒产生，此时排除即可，且使用OD需要有扎实的基础才能看懂。